→ بازگشت به هوش مصنوعی

مقدمه‌ای بر شبکه‌های عصبی

خلاصه مقدمه‌ای بر شبکه‌های عصبی

همان‌گونه که در مقدمه به آن پرداختیم، یکی از روش‌های دست‌یابی به هوشمندی، تعلیم یک الگوی رایانه‌ای یا یک مغز مصنوعی است. از میانه‌ی سده‌ی بیستم، پژوهشگران به آزمودن الگوهای ریاضی گوناگونی همت گماشتند تا آنکه در سال‌های اخیر این رویکرد به کامیابی چشمگیری نایل آمد. چنین الگوهای ریاضی از مغز را شبکه‌های عصبی می‌نامند.

گاه شبکه‌های عصبی را شبکه‌های عصبی مصنوعی یا ANNs می‌خوانند، تا بدین وسیله روشن گردد که مراد از آن، مدل‌هاست و نه شبکه‌های حقیقی از نورون‌ها.

یادگیری ماشین

شبکه‌های عصبی جزیی از یک رشته‌ی وسیع‌تر به نام یادگیری ماشین هستند که هدف آن بهره‌گیری از داده‌ها برای آموزش مدل‌های رایانه‌ای است که توانایی حل مسائل را دارند. یادگیری ماشین بخش عمده‌ای از هوش مصنوعی را شامل می‌شود، با این وجود، در این برنامه‌ی درسی به یادگیری ماشین کلاسیک پرداخته نمی‌شود.

در یادگیری ماشین، فرض بر این است که یک مجموعه داده از نمونه‌های X و مقادیر خروجی متناظر Y در اختیار داریم. نمونه‌های مذکور غالباً به صورت بردارهای N بعدی هستند که از ویژگی‌ها تشکیل شده‌اند و خروجی‌ها با عنوان برچسب شناخته می‌شوند.

در این مبحث، به بررسی دو مسئله‌ی متداول در یادگیری ماشین خواهیم پرداخت:

  • طبقه‌بندی، که در آن هدف، طبقه‌بندی یک شیء ورودی در دو یا چند کلاس می‌باشد.
  • رگرسیون، که در آن هدف، پیش‌بینی یک عدد برای هر یک از نمونه‌های ورودی است.

در نمایش ورودی‌ها و خروجی‌ها به صورت تانسورها، مجموعه داده‌ی ورودی به شکل ماتریسی با ابعاد M×N می‌باشد، که در آن M تعداد نمونه‌ها و N تعداد ویژگی‌ها را نشان می‌دهد. برچسب‌های خروجی Y نیز به صورت برداری با اندازه M نمایش داده می‌شوند.

در این برنامه درسی، تمرکز ما صرفاً بر مدل‌های شبکه عصبی خواهد بود.

مدل یک نورون

بر اساس دانش زیست‌شناسی، آگاهی داریم که مغز ما متشکل از سلول‌های عصبی است که هر یک از آن‌ها دارای چندین "ورودی" (آکسون) و یک خروجی (دندریت) می‌باشند. آکسون‌ها و دندریت‌ها قابلیت هدایت سیگنال‌های الکتریکی را دارند و اتصالات میان آکسون‌ها و دندریت‌ها می‌توانند درجات مختلفی از رسانایی را به نمایش بگذارند (که این امر توسط نرومدیاتور‌ها کنترل می‌شود).

مدل یک نورونمدل یک نورون
نورون واقعی (تصویر از ویکی‌پدیا)نورون مصنوعی (تصویر توسط نویسنده)

بنابراین، ساده‌ترین مدل ریاضی یک نورون شامل چندین ورودی X1, ..., XN و یک خروجی Y، و همچنین یک سری وزن W1, ..., WN می‌باشد. خروجی به صورت زیر محاسبه می‌گردد:

Y = f\left(\sum_{i=1}^N X_iW_i\right)

جایی که f یک تابع فعال‌سازی غیرخطی می‌باشد.

مدل‌های اولیه نورون در مقاله کلاسیک A logical calculus of the ideas immanent in nervous activity توسط وارن مک‌کولوک و والتر پیتس در سال ۱۹۴۳ توصیف گردید. دونالد هب در کتاب خود با عنوان "The Organization of Behavior: A Neuropsychological Theory" روشی را پیشنهاد نمود که بر اساس آن، این شبکه‌ها قابلیت آموزش‌پذیری دارند.

در این بخش

در این بخش، ما با موارد زیر آشنا خواهیم شد: