→ بازگشت به هوش مصنوعی مولد

مقدمه‌ای بر هوش مصنوعی مولد و مدل‌های زبانی بزرگ

هوش مصنوعی مولد، نوعی از فناوری هوش مصنوعی است که قادر به تولید متن، تصاویر و انواع دیگر محتوا می‌باشد. ویژگی بارز این فناوری این است که هر فرد می‌تواند با یک جستجوی متنی ساده و ارائه جمله‌ای به زبان طبیعی، از امکانات آن بهره‌مند شود. نیازی به یادگیری زبان‌های برنامه‌نویسی نظیر جاوا یا SQL برای دستیابی به نتایج ارزشمند وجود ندارد؛ بلکه تنها کافی است از زبان خود استفاده کرده و خواسته‌های خود را بیان کنید تا از یک مدل هوش مصنوعی پیشنهادات لازم را دریافت کنید. کاربردها و تأثیرات این فناوری بسیار گسترده است؛ به گونه‌ای که شما می‌توانید گزارش‌های مختلفی را بنویسید یا درک کنید، برنامه‌نویسی انجام دهید و بسیاری از وظایف دیگر را، همگی در عرض چند ثانیه، به انجام برسانید.

در این برنامه درسی، به تحلیل چگونگی استفاده استارتاپ ما از هوش مصنوعی مولد برای ایجاد سناریوهای نوین در عرصه آموزش خواهیم پرداخت.

مقدمه

این درس شامل موارد زیر خواهد بود:

  • معرفی سناریوی کسب‌وکار: ایده و مأموریت استارتاپ ما.
  • هوش مصنوعی مولد و چگونگی دستیابی ما به چشم‌انداز فناوری کنونی.
  • کارکردهای داخلی یک مدل زبانی بزرگ.
  • قابلیت‌ها و موارد استفاده عملی اساسی مدل‌های زبانی بزرگ.

اهداف یادگیری

پس از اتمام این درس، شما قادر خواهید بود:

  • مفهوم هوش مصنوعی مولد را درک کرده و نحوه عملکرد مدل‌های زبانی بزرگ را بشناسید.
  • با تمرکز بر سناریوهای آموزشی، چگونگی بهره‌برداری از مدل‌های زبانی بزرگ در موارد مختلف را بیاموزید.

سناریو: استارتاپ آموزشی ما

هوش مصنوعی مولد، اوج فناوری هوش مصنوعی را نمایان می‌سازد و مرزهای آنچه را که روزگاری غیرممکن به شمار می‌رفت، جابجا می‌کند. مدل‌های هوش مصنوعی مولد دارای چندین قابلیت و کاربرد هستند، اما در این برنامه آموزشی، به بررسی چگونگی تحول آموزش از طریق یک استارتاپ فرضی خواهیم پرداخت. ما این استارتاپ را استارتاپ ما می‌نامیم. تیم استارتاپ ما در حوزه آموزش با بیانیه مأموریتی بلندپروازانه به شرح زیر فعالیت می‌کند:

بهبود دسترسی به یادگیری به صورت جهانی، با تضمین دسترسی عادلانه به آموزش و ارائه تجربیات یادگیری شخصی‌شده بر اساس نیازهای هر یادگیرنده.

تیم استارتاپ ما بر این باور است که بدون بهره‌گیری از یکی از قدرتمندترین ابزارهای عصر حاضر – مدل‌های زبانی بزرگ (LLMs) – نخواهد توانست به این هدف نائل شود.

انتظار می‌رود که هوش مصنوعی مولد شیوه‌های یادگیری و تدریس را متحول کند، به گونه‌ای که دانش‌آموزان در هر ساعتی از شبانه‌روز به معلمان مجازی دسترسی داشته باشند که اطلاعات فراوان و مثال‌های متنوعی را ارائه می‌دهند و در عین حال معلمان با استفاده از ابزارهای نوآورانه قادر خواهند بود تا دانش‌آموزان خود را ارزیابی کرده و بازخوردهای لازم را ارائه دهند.

پنج دانش‌آموز جوان که به مانیتور نگاه می‌کنند - تصویر از FLUX

برای آغاز، بیایید به تعریف برخی از مفاهیم و اصطلاحات اساسی که در طول این دوره آموزشی مورد استفاده قرار خواهند گرفت، بپردازیم.

چگونه به هوش مصنوعی مولد دست‌یافتیم؟

با وجود هیاهوی فراوانی که اخیراً به واسطه معرفی مدل‌های هوش مصنوعی مولد به وجود آمده است، این فناوری سال‌هاست که در حال توسعه بوده و نخستین تلاش‌های تحقیقاتی به دهه 1960 بازمی‌گردد. اکنون در مرحله‌ای هستیم که هوش مصنوعی دارای قابلیت‌های شناختی مشابه انسان، از جمله امکان گفت‌وگو، گردیده است؛ موضوعی که با نمونه‌هایی نظیر ChatGPT اوپن‌ای‌آی مشخص می‌شود.

با نگاهی به گذشته، نخستین نمونه‌های هوش مصنوعی شامل ربات‌های چت متن‌پایه بودند که بر مبنای یک پایگاه دانش استخراج‌شده از گروهی از کارشناسان طراحی و در یک کامپیوتر پیاده‌سازی شده بودند. پاسخ‌ها در پایگاه دانش به وسیله کلمات کلیدی موجود در متن ورودی فعال می‌شدند. اما بسیار زود مشخص گردید که چنین روشی، که به استفاده از ربات‌های چت متن‌پایه می‌پرداخت، به خوبی قابل گسترش نیست.

یک رویکرد آماری در حوزه هوش مصنوعی: یادگیری ماشین

در دهه 90 میلادی، تحول چشمگیری با به‌کارگیری رویکردهای آماری در تحلیل متن رخ داد. این روند منجر به توسعه الگوریتم‌های جدیدی گردید که به نام یادگیری ماشین شناخته می‌شوند و قابلیت یادگیری الگوها از داده‌ها را دارند، بدون آنکه به طور صریح برنامه‌ریزی شده باشند. این رویکرد به ماشین این امکان را می‌دهد که درک زبان انسانی را شبیه‌سازی نماید: یک مدل آماری بر اساس جفت‌های متن-برچسب آموزش می‌بیند و از این طریق قادر می‌شود متن ورودی ناشناخته را با یک برچسب از پیش تعیین‌شده که نمایانگر نیت پیام است، طبقه‌بندی کند.

شبکه‌های عصبی و دستیاران مجازی مدرن

در سال‌های اخیر، پیشرفت‌های فناوری سخت‌افزار که قابلیت پردازش حجم‌های گسترده‌تری از داده‌ها و انجام محاسبات پیچیده‌تر را دارا می‌باشد، تحقیقات در زمینه‌های هوش مصنوعی را ترغیب نموده و به توسعه الگوریتم‌های پیشرفته یادگیری ماشین، که به آنها شبکه‌های عصبی یا الگوریتم‌های یادگیری عمیق اطلاق می‌شود، منجر گردیده است.

شبکه‌های عصبی (به‌ویژه شبکه‌های عصبی بازگشتی – RNNها) به طور قابل توجهی پردازش زبان طبیعی را بهبود بخشیده و امکان نمایندگی معانی متن را به‌گونه‌ای معنادار فراهم نموده‌اند، به نحوی که زمینه واژه‌ای در یک جمله مورد توجه قرار می‌گیرد.

این فناوری، دستیاران مجازی که در دهه اول قرن جدید به وجود آمده‌اند را توانمند ساخته است؛ این دستیاران به خوبی قادر به تفسیر زبان انسان، شناسایی نیازها و انجام اقداماتی به منظور برآورده ساختن آن نیازها هستند، نظیر پاسخ دادن با استفاده از سناریوهای از پیش تعیین‌شده یا بهره‌مندی از خدمات شخص ثالث.

هوش مصنوعی مولد در حال حاضر

بدین ترتیب، ما به هوش مصنوعی مولد کنونی دست یافته‌ایم که می‌توان آن را به عنوان یک زیرمجموعه‌ای از یادگیری عمیق تلقی نمود.

AI, ML, DL and Generative AI

پس از دهه‌ها تحقیق در حوزه هوش مصنوعی، یک معماری مدل جدید به نام ترنسفورمر توانست محدودیت‌های RNNها را پشت سر بگذارد و قادر به پذیرش توالی‌های بسیار طولانی‌تری از متن به عنوان ورودی گردد. ترنسفورمرها مبتنی بر مکانیزم توجه هستند که به مدل این امکان را می‌دهد تا وزن‌های متفاوتی به ورودی‌هایی که دریافت می‌کند اختصاص دهد و توجه بیشتری به اطلاعات مرتبط‌تر، صرف‌نظر از ترتیب آن‌ها در توالی متن، مبذول کند.

اکثر مدل‌های اخیر هوش مصنوعی مولد، که به عنوان مدل‌های زبانی بزرگ (LLMs) نیز شناخته می‌شوند، زیرا با ورودی‌ها و خروجی‌های متنی کار می‌کنند، بر اساس این معماری طراحی شده‌اند. نکته جالب در مورد این مدل‌ها، که بر روی مقادیر زیادی داده بدون برچسب از منابع متنوعی چون کتاب‌ها، مقالات و وب‌سایت‌ها آموزش دیده‌اند، این است که می‌توانند به طیف وسیعی از وظایف سازگار شوند و متنی با گرامر صحیح و شبیه به آثار خلاقانه تولید نمایند. بنابراین، نه تنها ظرفیت ماشین‌ها برای "درک" متن ورودی به طرز شگفت‌آوری افزایش یافته است، بلکه توانایی آن‌ها در تولید پاسخ‌های اصلی به زبان انسانی نیز ممکن گردیده است.

مدل‌های زبانی بزرگ چگونه عمل می‌کنند؟

در فصل بعد، به بررسی انواع مختلف مدل‌های هوش مصنوعی مولد خواهیم پرداخت، اما در حال حاضر اجازه دهید نگاهی به عملکرد مدل‌های زبانی بزرگ داشته باشیم، با تمرکز بر مدل‌های GPT (ترنسفورمر پیش‌آموزش‌دیده) از OpenAI.

  • توکن‌ساز، تبدیل متن به اعداد: مدل‌های زبانی بزرگ ورودی را به صورت متن دریافت کرده و خروجی را نیز به صورت متن تولید می‌نمایند. با این حال، به عنوان مدل‌های آماری، آن‌ها در کار با اعداد بسیار بهتر از توالی‌های متنی عمل می‌کنند. به همین دلیل، هر ورودی به مدل ابتدا توسط یک توکن‌ساز پردازش می‌شود، پیش از آنکه در مدل اصلی مورد استفاده قرار گیرد. یک توکن، بخش‌هایی از متن است که شامل تعدادی متغیر از کاراکترها می‌باشد، بنابراین وظیفه اصلی توکن‌ساز، تقسیم ورودی به یک آرایه توکن‌هاست. در ادامه، هر توکن به یک شاخص توکن که معادل عددی متن اصلی است، نگاشته می‌شود.

مثالی از توکن‌سازی

  • پیش‌بینی توکن‌های خروجی: با در نظر گرفتن n توکن به عنوان ورودی (که حداکثر n با توجه به مدل‌های مختلف متفاوت است)، مدل قادر است یک توکن را به عنوان خروجی پیش‌بینی نماید. این توکن سپس به ورودی مرحله بعدی افزوده می‌شود، در یک الگوی پنجره گسترش‌یافته، که تجربه کاربری بهتری را برای دریافت یک یا چند جمله به عنوان پاسخ فراهم می‌آورد.
  • فرایند انتخاب و توزیع احتمال: توکن خروجی به وسیله‌ی مدل بر اساس احتمال وقوع آن پس از توالی متن فعلی انتخاب می‌شود. این امر به دلیل آن است که مدل یک توزیع احتمال برای تمامی توکن‌های ممکن در مرحله‌ی بعد پیش‌بینی می‌کند که بر اساس آموزش خود محاسبه شده است. با این حال، همواره توکن با بالاترین احتمال از این توزیع انتخاب نمی‌شود. مقداری تصادفی بودن به این انتخاب افزوده می‌شود تا مدل به صورت غیرقطعی عمل نماید؛ به عبارت دیگر، برای ورودی مشابه، خروجی دقیقا یکسانی دریافت نمی‌شود. این میزان تصادفی بودن به منظور شبیه‌سازی فرآیند تفکر خلاق به مدل افزوده می‌شود و می‌توان آن را از طریق پارامتر مدلی به نام دما (temprature) تنظیم کرد.

چگونه استارتاپ ما می‌تواند از مدل‌های زبانی بزرگ بهره‌برداری کند؟

در این مرحله که درک بهتری از نحوه عملکرد مدل‌های زبانی بزرگ پیدا کرده‌ایم، به بررسی چند مثال عملی از متداول‌ترین وظایفی که این مدل‌ها می‌توانند به خوبی انجام دهند، خواهیم پرداخت و به سناریوی کسب‌وکار خود نگاهی خواهیم انداخت. ما به این نکته اشاره کردیم که قابلیت اصلی یک مدل‌ زبانی بزرگ، تولید متن از ابتدا، بر اساس یک ورودی متنی، نوشته شده به زبان طبیعی است.

اما نوع ورودی و خروجی متنی مورد نظر چیست؟ ورودی مدل‌ زبانی بزرگ به عنوان پرسش (prompt) شناخته می‌شود، در حالی که خروجی به عنوان تکمیل (completion) شناخته می‌شود؛ اصطلاحی که به مکانیسم مدل برای تولید توکن بعدی به منظور تکمیل ورودی فعلی اشاره دارد. ما به طور عمیق‌تر به مفهوم پرسش و نحوه طراحی آن به گونه‌ای که بیشترین بهره‌وری را از مدل‌مان به همراه داشته باشد، خواهیم پرداخت. اما در حال حاضر، فقط به این نکته بسنده می‌کنیم که یک پرسش می‌تواند شامل:

  • یک دستور که نوع خروجی مورد انتظار از مدل را مشخص می‌سازد. این دستور ممکن است گاه شامل مثال‌ها یا داده‌های اضافی باشد.

    1. خلاصه‌سازی مقالات، کتاب‌ها، بررسی محصولات و دیگر منابع، به همراه استخراج بینش‌ها از داده‌های نامنظم.

    Example of summarization


    1. ایده‌پردازی خلاقانه و طراحی یک مقاله، یک انشا، یک تکلیف یا چندین مورد دیگر.

    Example of creative writing


  • یک سوال که به‌صورت گفتگویی از یک عامل پرسش شده است.

Example of conversation


  • بخشی از متن که نیاز به تکمیل دارد و به طور ضمنی درخواست کمک در نوشتن است.

Example of text completion


  • یک بخش از کد به همراه درخواست توضیحات و مستندسازی آن، یا کامنتی که از آن خواسته می‌شود تا قطعه‌ای از کد برای انجام یک وظیفه خاص تولید نماید.

Coding example


متن‌های فوق نسبتاً ساده هستند و هدف آن‌ها نشان دادن قابلیت‌های کامل مدل‌های زبانی بزرگ نیست. آن‌ها تنها قصد دارند پتانسیل استفاده از هوش مصنوعی مولد را به ویژه در زمینه‌های آموزشی، اما نه به‌طور خاص، نمایان سازند.

علاوه بر این، خروجی یک مدل هوش مصنوعی مولد همواره کامل نیست و گاهی خلاقیت مدل ممکن است به ضرر آن تمام شود و منجر به تولید متنی گردد که کاربر انسانی بتواند آن را به‌عنوان تحریف واقعیت تفسیر کند، یا اینکه ممکن است شامل مطالب توهین‌آمیز باشد. هوش مصنوعی در واقع هوشمند نیست - حداقل بر اساس تعاریف جامع‌تری که شامل استدلال انتقادی، خلاقیت و هوش عاطفی می‌شود. این سیستم‌ها قطعیت و قابلیت اعتماد لازم را ندارند و به دلیل امکان بروز جعل‌ها، مانند ارجاعات نادرست، محتوا و بیانات، ممکن است با اطلاعات صحیح ترکیب شده و به شکلی قانع‌کننده و با اعتماد به نفس ارائه شوند. در درس‌های بعدی، به بررسی تمام این محدودیت‌ها خواهیم پرداخت و خواهیم دید که چه کاری می‌توانیم برای کاهش آن‌ها انجام دهیم.

تکلیف

تکلیف شما این است که درباره هوش مصنوعی مولد به‌ طور مفصل مطالعه کنید و سعی کنید زمینه‌ای را شناسایی نمایید که امروز بتوانید هوش مصنوعی مولد را در آن مورد استفاده قرار دهید و تاکنون وجود نداشته باشد. تأثیر این فناوری چگونه با روش‌های سنتی متفاوت خواهد بود؟ آیا می‌توانید اقداماتی را انجام دهید که پیش از این امکان‌پذیر نبوده یا اینکه سرعت انجام کارها را افزایش دهید؟ لطفاً یک خلاصه 300 کلمه‌ای درباره اینکه استارتاپ ایده‌آل شما در حوزه هوش مصنوعی چگونه خواهد بود، تهیه کنید و شامل عناوینی چون "مسئله"، "چگونگی استفاده از هوش مصنوعی"، "تأثیر" و به‌طور اختیاری یک طرح کسب‌وکار باشد.