Hugging Face 101: یک راهنمای آموزشی برای مبتدیان!
به این راهنمای آموزشی برای مبتدیان در راستای تحلیل احساسات با استفاده از تبدیلکنندههای Hugging Face خوش آمدید! تحلیل احساسات یک تکنیک در پردازش زبان طبیعی (NLP) است که به منظور تعیین لحن یا احساس عاطفی بیان شده در یک قطعه متن استفاده میشود.
در این آموزش، شما با نحوه استفاده از مدلهای پیشآموزشدیده یادگیری ماشین از Hugging Face برای اجرای تحلیل احساسات بر روی نمونههای متنی مختلف آشنا خواهید شد. ما شما را در تمام مراحل راهنمایی خواهیم کرد، از نصب بستههای لازم تا اجرای مدل و تفسیر خروجی آن، همه در یک محیط SingleStore Notebook، مشابه Jupyter Notebook.
تا پایان این آموزش، شما با دانش لازم برای استفاده از Hugging Face Transformers به عنوان یک کتابخانه برای تحلیل احساسات دادههای متنی آشنا خواهید شد.
Hugging Face چیست؟🤗
Hugging Face🤗 یک جامعه تخصصی در زمینه پردازش زبان طبیعی (NLP) و هوش مصنوعی (AI) به شمار میآید. این شرکت در سال 2016 تأسیس شده و به طور قابل توجهی به دمکراتیزه کردن دسترسی به مدلها و ابزارهای پیشرفته یادگیری ماشین در حوزه NLP یاری رسانده است.
Hugging Face بر روی تقویت جامعه متمرکز است و پلتفرمی فراهم کرده است که در آن محققان و توسعهدهندگان میتوانند مدلهای آموزشدیده خود را به اشتراک بگذارند و بدین ترتیب همکاری و پیشرفت در این حوزه را تسریع کنند.
NLP مخفف پردازش زبان طبیعی است که به تعامل میان کامپیوترها و زبان انسانی مرتبط میشود. Hugging Face به خاطر ارائه کمکهای شایان به این رشته از طریق کتابخانههای متنباز، مدلهای پیشآموزشدیده و پلتفرمهای اجتماعی معروف است.
تبدیلکنندههای Hugging Face🤗 به عنوان یک کتابخانه:
کتابخانه تبدیلکنندههای Hugging Face یک کتابخانه متنباز برای NLP و یادگیری ماشین به شمار میآید. این کتابخانه مجموعهای گسترده از مدلها و معماریهای پیشآموزشدیده، نظیر BERT، GPT-2، T5 و بسیاری دیگر را ارائه میدهد. طراحی این کتابخانه به گونهای است که مدولار و آسان برای استفاده باشد و کمک به توسعه سریع پروژههای تحقیقاتی و تولیدی کند. این کتابخانه از چندین زبان و وظایف مختلف نظیر طبقهبندی متن، پاسخ به سوالات، تولید متن، ترجمه و غیره پشتیبانی میکند.
پیشنیازها
قبل از آغاز این آموزش، اطمینان حاصل کنید که پیشنیازهای زیر را در نظر دارید:
- تنها پیشنیاز این آموزش، وجود SingleStore Notebook است. این آموزش به گونهای طراحی شده که در محیط SingleStore Notebook دنبال شود. اگر هنوز SingleStore Notebook را نصب نکردهاید، میتوانید با ثبتنام در SingleStore و سپس انتخاب ویژگی Notebook، آن را نصب نمایید.
یک نوتبوک خالی جدید ایجاد کنید.
شما به داشبورد نوتبوک سینگلاستور منتقل خواهید شد.
از اینجا، ما از آن به عنوان محیط اجرای دستورات پایتون خود بهرهبرداری خواهیم کرد.
مرحله 1: نصب بستههای مورد نیاز
ابتدا، باید کتابخانه تبدیلکنندهها از Hugging Face را نصب نمایید. میتوانید این کار را با استفاده از pip انجام دهید:
!pip install transformers
PyTorch پیشنیاز استفاده از کتابخانه تبدیلکنندههای Hugging Face است.
شما میتوانید PyTorch را با اجرای فرمان زیر در نوتبوک سینگلاستور خود نصب کنید:
!pip install torch
راهاندازی مجدد هسته: پس از نصب، ممکن است نیاز باشد که هسته نوتبوک سینگلاستور را راهاندازی مجدد کنید تا اطمینان حاصل شود که بستههای جدید نصب شده شناسایی میشوند. معمولاً میتوانید این کار را با کلیک بر روی "Kernel" در منو و سپس انتخاب "Restart Kernel" انجام دهید.
مرحله 2: وارد کردن کتابخانهها
کتابخانههای مورد نیاز پایتون را وارد کنید:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
مرحله 3: بارگذاری مدل و توکنایزر پیشآموزشدیده
یک مدل پیشآموزشدیده و توکنایزر مربوط به آن را بارگذاری نمایید. برای این مثال، بیایید از مدل distilbert-base-uncased-finetuned-sst-2-english برای تحلیل احساسات استفاده کنیم.
tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")
مرحله 4: پیشپردازش متن
متن مورد نظر برای تحلیل را توکنایز کنید:
text = "I love programming!"
tokens = tokenizer(text, padding=True, truncation=True, return_tensors="pt")
مرحله 5: استنتاج مدل
متن توکنایز شده را از طریق مدل پردازش نمایید:
with torch.no_grad():
outputs = model(**tokens)
logits = outputs.logits
probabilities = torch.softmax(logits, dim=1)
مرحله 6: تفسیر نتایج
خروجی مدل را برای استخراج احساسات تفسیر کنید:
label_ids = torch.argmax(probabilities, dim=1)
labels = ['منفی', 'مثبت']
label = labels[label_ids]
print(f"احساسات این است: {label}")
این باید خروجی "مثبت" یا "منفی" را بر اساس احساسات متن ارائه دهد.
اطمینان حاصل کنید که کد خود را در بستر نوتبوک سینگلاستور اجرا مینمایید.
بیایید متن را که میخواهیم تحلیل کنیم، از "I love programming!"
به "I hate programming!"
تغییر دهیم. شما باید تحلیل احساسات منفی را مشاهده کنید.
بیایید یک جمله دیگر را تحلیل کنیم: "SingleStore's Notebook feature is just mind blowing!"
و ببینیم پاسخ چیست. (باید مثبت باشد همانطور که انتظار میرود)
تبریک به خاطر اتمام این راهنمای آموزشی برای مبتدیان در زمینه تحلیل احساسات با استفاده از کتابخانههای تبدیلکنندههای Hugging Face! اکنون، شما باید درکی کافی از روش استفاده از مدلهای پیشآموزشدیده برای تحلیل احساسات متون داشته باشید. شما یاد گرفتهاید که چگونه متن را توکنایز کنید، آن را از طریق یک مدل پردازش نمایید و خروجی را تفسیر کنید - همه در یک محیط نوتبوک سینگلاستور.
منبع
https://dev.to/pavanbelagatti/hugging-face-101-a-tutorial-for-absolute-beginners-3b0l