مقدمهای بر شبکههای عصبی
همانگونه که در مقدمه به آن پرداختیم، یکی از روشهای دستیابی به هوشمندی، تعلیم یک الگوی رایانهای یا یک مغز مصنوعی است. از میانهی سدهی بیستم، پژوهشگران به آزمودن الگوهای ریاضی گوناگونی همت گماشتند تا آنکه در سالهای اخیر این رویکرد به کامیابی چشمگیری نایل آمد. چنین الگوهای ریاضی از مغز را شبکههای عصبی مینامند.
گاه شبکههای عصبی را شبکههای عصبی مصنوعی یا ANNs میخوانند، تا بدین وسیله روشن گردد که مراد از آن، مدلهاست و نه شبکههای حقیقی از نورونها.
یادگیری ماشین
شبکههای عصبی جزیی از یک رشتهی وسیعتر به نام یادگیری ماشین هستند که هدف آن بهرهگیری از دادهها برای آموزش مدلهای رایانهای است که توانایی حل مسائل را دارند. یادگیری ماشین بخش عمدهای از هوش مصنوعی را شامل میشود، با این وجود، در این برنامهی درسی به یادگیری ماشین کلاسیک پرداخته نمیشود.
در یادگیری ماشین، فرض بر این است که یک مجموعه داده از نمونههای X و مقادیر خروجی متناظر Y در اختیار داریم. نمونههای مذکور غالباً به صورت بردارهای N بعدی هستند که از ویژگیها تشکیل شدهاند و خروجیها با عنوان برچسب شناخته میشوند.
در این مبحث، به بررسی دو مسئلهی متداول در یادگیری ماشین خواهیم پرداخت:
- طبقهبندی، که در آن هدف، طبقهبندی یک شیء ورودی در دو یا چند کلاس میباشد.
- رگرسیون، که در آن هدف، پیشبینی یک عدد برای هر یک از نمونههای ورودی است.
در نمایش ورودیها و خروجیها به صورت تانسورها، مجموعه دادهی ورودی به شکل ماتریسی با ابعاد M×N میباشد، که در آن M تعداد نمونهها و N تعداد ویژگیها را نشان میدهد. برچسبهای خروجی Y نیز به صورت برداری با اندازه M نمایش داده میشوند.
در این برنامه درسی، تمرکز ما صرفاً بر مدلهای شبکه عصبی خواهد بود.
مدل یک نورون
بر اساس دانش زیستشناسی، آگاهی داریم که مغز ما متشکل از سلولهای عصبی است که هر یک از آنها دارای چندین "ورودی" (آکسون) و یک خروجی (دندریت) میباشند. آکسونها و دندریتها قابلیت هدایت سیگنالهای الکتریکی را دارند و اتصالات میان آکسونها و دندریتها میتوانند درجات مختلفی از رسانایی را به نمایش بگذارند (که این امر توسط نرومدیاتورها کنترل میشود).
نورون واقعی (تصویر از ویکیپدیا) | نورون مصنوعی (تصویر توسط نویسنده) |
بنابراین، سادهترین مدل ریاضی یک نورون شامل چندین ورودی X1, ..., XN و یک خروجی Y، و همچنین یک سری وزن W1, ..., WN میباشد. خروجی به صورت زیر محاسبه میگردد:
جایی که f یک تابع فعالسازی غیرخطی میباشد.
مدلهای اولیه نورون در مقاله کلاسیک A logical calculus of the ideas immanent in nervous activity توسط وارن مککولوک و والتر پیتس در سال ۱۹۴۳ توصیف گردید. دونالد هب در کتاب خود با عنوان "The Organization of Behavior: A Neuropsychological Theory" روشی را پیشنهاد نمود که بر اساس آن، این شبکهها قابلیت آموزشپذیری دارند.
در این بخش
در این بخش، ما با موارد زیر آشنا خواهیم شد:
- پرسپترون، یکی از نخستین مدلهای شبکه عصبی برای طبقهبندی دو کلاسه
- شبکههای چند لایه همراه با یک نوتبوک مرتبط با عنوان چگونگی ساخت چارچوب شخصی
- چارچوبهای شبکه عصبی، همراه با این نوتبوکها: PyTorch و Keras/Tensorflow
- بیشبرازش