مقدمهای بر هوش مصنوعی مولد و مدلهای زبانی بزرگ
هوش مصنوعی مولد، نوعی از فناوری هوش مصنوعی است که قادر به تولید متن، تصاویر و انواع دیگر محتوا میباشد. ویژگی بارز این فناوری این است که هر فرد میتواند با یک جستجوی متنی ساده و ارائه جملهای به زبان طبیعی، از امکانات آن بهرهمند شود. نیازی به یادگیری زبانهای برنامهنویسی نظیر جاوا یا SQL برای دستیابی به نتایج ارزشمند وجود ندارد؛ بلکه تنها کافی است از زبان خود استفاده کرده و خواستههای خود را بیان کنید تا از یک مدل هوش مصنوعی پیشنهادات لازم را دریافت کنید. کاربردها و تأثیرات این فناوری بسیار گسترده است؛ به گونهای که شما میتوانید گزارشهای مختلفی را بنویسید یا درک کنید، برنامهنویسی انجام دهید و بسیاری از وظایف دیگر را، همگی در عرض چند ثانیه، به انجام برسانید.
در این برنامه درسی، به تحلیل چگونگی استفاده استارتاپ ما از هوش مصنوعی مولد برای ایجاد سناریوهای نوین در عرصه آموزش خواهیم پرداخت.
مقدمه
این درس شامل موارد زیر خواهد بود:
- معرفی سناریوی کسبوکار: ایده و مأموریت استارتاپ ما.
- هوش مصنوعی مولد و چگونگی دستیابی ما به چشمانداز فناوری کنونی.
- کارکردهای داخلی یک مدل زبانی بزرگ.
- قابلیتها و موارد استفاده عملی اساسی مدلهای زبانی بزرگ.
اهداف یادگیری
پس از اتمام این درس، شما قادر خواهید بود:
- مفهوم هوش مصنوعی مولد را درک کرده و نحوه عملکرد مدلهای زبانی بزرگ را بشناسید.
- با تمرکز بر سناریوهای آموزشی، چگونگی بهرهبرداری از مدلهای زبانی بزرگ در موارد مختلف را بیاموزید.
سناریو: استارتاپ آموزشی ما
هوش مصنوعی مولد، اوج فناوری هوش مصنوعی را نمایان میسازد و مرزهای آنچه را که روزگاری غیرممکن به شمار میرفت، جابجا میکند. مدلهای هوش مصنوعی مولد دارای چندین قابلیت و کاربرد هستند، اما در این برنامه آموزشی، به بررسی چگونگی تحول آموزش از طریق یک استارتاپ فرضی خواهیم پرداخت. ما این استارتاپ را استارتاپ ما مینامیم. تیم استارتاپ ما در حوزه آموزش با بیانیه مأموریتی بلندپروازانه به شرح زیر فعالیت میکند:
بهبود دسترسی به یادگیری به صورت جهانی، با تضمین دسترسی عادلانه به آموزش و ارائه تجربیات یادگیری شخصیشده بر اساس نیازهای هر یادگیرنده.
تیم استارتاپ ما بر این باور است که بدون بهرهگیری از یکی از قدرتمندترین ابزارهای عصر حاضر – مدلهای زبانی بزرگ (LLMs) – نخواهد توانست به این هدف نائل شود.
انتظار میرود که هوش مصنوعی مولد شیوههای یادگیری و تدریس را متحول کند، به گونهای که دانشآموزان در هر ساعتی از شبانهروز به معلمان مجازی دسترسی داشته باشند که اطلاعات فراوان و مثالهای متنوعی را ارائه میدهند و در عین حال معلمان با استفاده از ابزارهای نوآورانه قادر خواهند بود تا دانشآموزان خود را ارزیابی کرده و بازخوردهای لازم را ارائه دهند.
برای آغاز، بیایید به تعریف برخی از مفاهیم و اصطلاحات اساسی که در طول این دوره آموزشی مورد استفاده قرار خواهند گرفت، بپردازیم.
چگونه به هوش مصنوعی مولد دستیافتیم؟
با وجود هیاهوی فراوانی که اخیراً به واسطه معرفی مدلهای هوش مصنوعی مولد به وجود آمده است، این فناوری سالهاست که در حال توسعه بوده و نخستین تلاشهای تحقیقاتی به دهه 1960 بازمیگردد. اکنون در مرحلهای هستیم که هوش مصنوعی دارای قابلیتهای شناختی مشابه انسان، از جمله امکان گفتوگو، گردیده است؛ موضوعی که با نمونههایی نظیر ChatGPT اوپنایآی مشخص میشود.
با نگاهی به گذشته، نخستین نمونههای هوش مصنوعی شامل رباتهای چت متنپایه بودند که بر مبنای یک پایگاه دانش استخراجشده از گروهی از کارشناسان طراحی و در یک کامپیوتر پیادهسازی شده بودند. پاسخها در پایگاه دانش به وسیله کلمات کلیدی موجود در متن ورودی فعال میشدند. اما بسیار زود مشخص گردید که چنین روشی، که به استفاده از رباتهای چت متنپایه میپرداخت، به خوبی قابل گسترش نیست.
یک رویکرد آماری در حوزه هوش مصنوعی: یادگیری ماشین
در دهه 90 میلادی، تحول چشمگیری با بهکارگیری رویکردهای آماری در تحلیل متن رخ داد. این روند منجر به توسعه الگوریتمهای جدیدی گردید که به نام یادگیری ماشین شناخته میشوند و قابلیت یادگیری الگوها از دادهها را دارند، بدون آنکه به طور صریح برنامهریزی شده باشند. این رویکرد به ماشین این امکان را میدهد که درک زبان انسانی را شبیهسازی نماید: یک مدل آماری بر اساس جفتهای متن-برچسب آموزش میبیند و از این طریق قادر میشود متن ورودی ناشناخته را با یک برچسب از پیش تعیینشده که نمایانگر نیت پیام است، طبقهبندی کند.
شبکههای عصبی و دستیاران مجازی مدرن
در سالهای اخیر، پیشرفتهای فناوری سختافزار که قابلیت پردازش حجمهای گستردهتری از دادهها و انجام محاسبات پیچیدهتر را دارا میباشد، تحقیقات در زمینههای هوش مصنوعی را ترغیب نموده و به توسعه الگوریتمهای پیشرفته یادگیری ماشین، که به آنها شبکههای عصبی یا الگوریتمهای یادگیری عمیق اطلاق میشود، منجر گردیده است.
شبکههای عصبی (بهویژه شبکههای عصبی بازگشتی – RNNها) به طور قابل توجهی پردازش زبان طبیعی را بهبود بخشیده و امکان نمایندگی معانی متن را بهگونهای معنادار فراهم نمودهاند، به نحوی که زمینه واژهای در یک جمله مورد توجه قرار میگیرد.
این فناوری، دستیاران مجازی که در دهه اول قرن جدید به وجود آمدهاند را توانمند ساخته است؛ این دستیاران به خوبی قادر به تفسیر زبان انسان، شناسایی نیازها و انجام اقداماتی به منظور برآورده ساختن آن نیازها هستند، نظیر پاسخ دادن با استفاده از سناریوهای از پیش تعیینشده یا بهرهمندی از خدمات شخص ثالث.
هوش مصنوعی مولد در حال حاضر
بدین ترتیب، ما به هوش مصنوعی مولد کنونی دست یافتهایم که میتوان آن را به عنوان یک زیرمجموعهای از یادگیری عمیق تلقی نمود.
پس از دههها تحقیق در حوزه هوش مصنوعی، یک معماری مدل جدید به نام ترنسفورمر توانست محدودیتهای RNNها را پشت سر بگذارد و قادر به پذیرش توالیهای بسیار طولانیتری از متن به عنوان ورودی گردد. ترنسفورمرها مبتنی بر مکانیزم توجه هستند که به مدل این امکان را میدهد تا وزنهای متفاوتی به ورودیهایی که دریافت میکند اختصاص دهد و توجه بیشتری به اطلاعات مرتبطتر، صرفنظر از ترتیب آنها در توالی متن، مبذول کند.
اکثر مدلهای اخیر هوش مصنوعی مولد، که به عنوان مدلهای زبانی بزرگ (LLMs) نیز شناخته میشوند، زیرا با ورودیها و خروجیهای متنی کار میکنند، بر اساس این معماری طراحی شدهاند. نکته جالب در مورد این مدلها، که بر روی مقادیر زیادی داده بدون برچسب از منابع متنوعی چون کتابها، مقالات و وبسایتها آموزش دیدهاند، این است که میتوانند به طیف وسیعی از وظایف سازگار شوند و متنی با گرامر صحیح و شبیه به آثار خلاقانه تولید نمایند. بنابراین، نه تنها ظرفیت ماشینها برای "درک" متن ورودی به طرز شگفتآوری افزایش یافته است، بلکه توانایی آنها در تولید پاسخهای اصلی به زبان انسانی نیز ممکن گردیده است.
مدلهای زبانی بزرگ چگونه عمل میکنند؟
در فصل بعد، به بررسی انواع مختلف مدلهای هوش مصنوعی مولد خواهیم پرداخت، اما در حال حاضر اجازه دهید نگاهی به عملکرد مدلهای زبانی بزرگ داشته باشیم، با تمرکز بر مدلهای GPT (ترنسفورمر پیشآموزشدیده) از OpenAI.
- توکنساز، تبدیل متن به اعداد: مدلهای زبانی بزرگ ورودی را به صورت متن دریافت کرده و خروجی را نیز به صورت متن تولید مینمایند. با این حال، به عنوان مدلهای آماری، آنها در کار با اعداد بسیار بهتر از توالیهای متنی عمل میکنند. به همین دلیل، هر ورودی به مدل ابتدا توسط یک توکنساز پردازش میشود، پیش از آنکه در مدل اصلی مورد استفاده قرار گیرد. یک توکن، بخشهایی از متن است که شامل تعدادی متغیر از کاراکترها میباشد، بنابراین وظیفه اصلی توکنساز، تقسیم ورودی به یک آرایه توکنهاست. در ادامه، هر توکن به یک شاخص توکن که معادل عددی متن اصلی است، نگاشته میشود.
- پیشبینی توکنهای خروجی: با در نظر گرفتن n توکن به عنوان ورودی (که حداکثر n با توجه به مدلهای مختلف متفاوت است)، مدل قادر است یک توکن را به عنوان خروجی پیشبینی نماید. این توکن سپس به ورودی مرحله بعدی افزوده میشود، در یک الگوی پنجره گسترشیافته، که تجربه کاربری بهتری را برای دریافت یک یا چند جمله به عنوان پاسخ فراهم میآورد.
- فرایند انتخاب و توزیع احتمال: توکن خروجی به وسیلهی مدل بر اساس احتمال وقوع آن پس از توالی متن فعلی انتخاب میشود. این امر به دلیل آن است که مدل یک توزیع احتمال برای تمامی توکنهای ممکن در مرحلهی بعد پیشبینی میکند که بر اساس آموزش خود محاسبه شده است. با این حال، همواره توکن با بالاترین احتمال از این توزیع انتخاب نمیشود. مقداری تصادفی بودن به این انتخاب افزوده میشود تا مدل به صورت غیرقطعی عمل نماید؛ به عبارت دیگر، برای ورودی مشابه، خروجی دقیقا یکسانی دریافت نمیشود. این میزان تصادفی بودن به منظور شبیهسازی فرآیند تفکر خلاق به مدل افزوده میشود و میتوان آن را از طریق پارامتر مدلی به نام دما (temprature) تنظیم کرد.
چگونه استارتاپ ما میتواند از مدلهای زبانی بزرگ بهرهبرداری کند؟
در این مرحله که درک بهتری از نحوه عملکرد مدلهای زبانی بزرگ پیدا کردهایم، به بررسی چند مثال عملی از متداولترین وظایفی که این مدلها میتوانند به خوبی انجام دهند، خواهیم پرداخت و به سناریوی کسبوکار خود نگاهی خواهیم انداخت. ما به این نکته اشاره کردیم که قابلیت اصلی یک مدل زبانی بزرگ، تولید متن از ابتدا، بر اساس یک ورودی متنی، نوشته شده به زبان طبیعی است.
اما نوع ورودی و خروجی متنی مورد نظر چیست؟ ورودی مدل زبانی بزرگ به عنوان پرسش (prompt) شناخته میشود، در حالی که خروجی به عنوان تکمیل (completion) شناخته میشود؛ اصطلاحی که به مکانیسم مدل برای تولید توکن بعدی به منظور تکمیل ورودی فعلی اشاره دارد. ما به طور عمیقتر به مفهوم پرسش و نحوه طراحی آن به گونهای که بیشترین بهرهوری را از مدلمان به همراه داشته باشد، خواهیم پرداخت. اما در حال حاضر، فقط به این نکته بسنده میکنیم که یک پرسش میتواند شامل:
-
یک دستور که نوع خروجی مورد انتظار از مدل را مشخص میسازد. این دستور ممکن است گاه شامل مثالها یا دادههای اضافی باشد.
- خلاصهسازی مقالات، کتابها، بررسی محصولات و دیگر منابع، به همراه استخراج بینشها از دادههای نامنظم.
- ایدهپردازی خلاقانه و طراحی یک مقاله، یک انشا، یک تکلیف یا چندین مورد دیگر.
-
یک سوال که بهصورت گفتگویی از یک عامل پرسش شده است.
- بخشی از متن که نیاز به تکمیل دارد و به طور ضمنی درخواست کمک در نوشتن است.
- یک بخش از کد به همراه درخواست توضیحات و مستندسازی آن، یا کامنتی که از آن خواسته میشود تا قطعهای از کد برای انجام یک وظیفه خاص تولید نماید.
متنهای فوق نسبتاً ساده هستند و هدف آنها نشان دادن قابلیتهای کامل مدلهای زبانی بزرگ نیست. آنها تنها قصد دارند پتانسیل استفاده از هوش مصنوعی مولد را به ویژه در زمینههای آموزشی، اما نه بهطور خاص، نمایان سازند.
علاوه بر این، خروجی یک مدل هوش مصنوعی مولد همواره کامل نیست و گاهی خلاقیت مدل ممکن است به ضرر آن تمام شود و منجر به تولید متنی گردد که کاربر انسانی بتواند آن را بهعنوان تحریف واقعیت تفسیر کند، یا اینکه ممکن است شامل مطالب توهینآمیز باشد. هوش مصنوعی در واقع هوشمند نیست - حداقل بر اساس تعاریف جامعتری که شامل استدلال انتقادی، خلاقیت و هوش عاطفی میشود. این سیستمها قطعیت و قابلیت اعتماد لازم را ندارند و به دلیل امکان بروز جعلها، مانند ارجاعات نادرست، محتوا و بیانات، ممکن است با اطلاعات صحیح ترکیب شده و به شکلی قانعکننده و با اعتماد به نفس ارائه شوند. در درسهای بعدی، به بررسی تمام این محدودیتها خواهیم پرداخت و خواهیم دید که چه کاری میتوانیم برای کاهش آنها انجام دهیم.
تکلیف
تکلیف شما این است که درباره هوش مصنوعی مولد به طور مفصل مطالعه کنید و سعی کنید زمینهای را شناسایی نمایید که امروز بتوانید هوش مصنوعی مولد را در آن مورد استفاده قرار دهید و تاکنون وجود نداشته باشد. تأثیر این فناوری چگونه با روشهای سنتی متفاوت خواهد بود؟ آیا میتوانید اقداماتی را انجام دهید که پیش از این امکانپذیر نبوده یا اینکه سرعت انجام کارها را افزایش دهید؟ لطفاً یک خلاصه 300 کلمهای درباره اینکه استارتاپ ایدهآل شما در حوزه هوش مصنوعی چگونه خواهد بود، تهیه کنید و شامل عناوینی چون "مسئله"، "چگونگی استفاده از هوش مصنوعی"، "تأثیر" و بهطور اختیاری یک طرح کسبوکار باشد.