«مدلهای زبانی کوچک» زندگی روزمره را هوشمند میکنند
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ انتشار عمومی چتچیپیتی، چتبات مشهور شرکت «OpenAI»، در نوامبر سال ۲۰۲۲، هیاهویی بزرگ در فناوری هوش مصنوعی بپا کرد و سبب تشدید رقابت میان غولهای فناوری شد.
اکنون بسیاری از شرکتهای بزرگ فناوری در اقصی نقاط جهان، در عرصه توسعه هوش مصنوعی مولد و مدلهای زبانی بزرگ گام برداشته و محصولاتی مبتنی بر این فناوری تولید کردهاند.
در این میان، شرکت مایکروسافت روز ۲۳ آوریل از تحولی بزرگ در این رقابت همهجانبه خبر داد. این شرکت اعلام کرد که در راستای جذب مشتریان متقاضی گزینههای مقرون به صرفه، یک مدل زبانی کوچک (SLM) خواهد ساخت. مدل جدید به نام «Phi 3 mini» اولین نسخه از سه مدل زبانی کوچک است که این شرکت قصد دارد، در آینده نزدیک عرضه کند. طبق اعلام کارشناسان این شرکت، مدل مذکور با هزینه پایینتر نسبت به مدلهای زبانی بزرگ، طیف گستردهای از قابلیتها را در اختیار کاربران قرار میدهد.
به عقیده کارشناسان، مدلهای زبانی کوچک، در چشمانداز به سرعت در حال تکامل هوش مصنوعی، به عنوان یک پیشرفت مهم ظاهر شدهاند و نویدبخش توسعه فناوری هوش مصنوعی با دسترسی بیشتر، کارآمدی بالاتر و هزینه کمتر هستند.
این نوشتار کوتاه به بررسی ماهیت، ویژگیها، مزایا، چالشها و چشم اندازهای آینده مدلهای کوچک زبانی اختصاص دارد.
چیستی و ماهیت مدلهای زبانی کوچک
مدلهای زبانی کوچک، نسخههای کوچکشده مدلهای هوش مصنوعی بزرگتر هستند که برای انجام وظایف مشابه در حوزه پردازش زبان طبیعی، مانند تولید متن، تصویر، ترجمه و … مورد استفاده قرار میگیرند. این مدلها با پارامترهای کمتر و در نتیجه نیازهای محاسباتی کمتر طراحی شدهاند. به عقیده بسیاری از متخصصان، درک مفهوم حفظ تعادل بین عملکرد و کارایی، امکان استفاده گستردهتر هوش مصنوعی مولد در دستگاهها و برنامههای کمقدرتتر را فراهم میکند؛ دستگاههایی که استقرار مدلهای بزرگ در آنها عملاً غیرممکن است.
از مزایای کلیدی استفاده از مدلهای زبانی کوچک میتوان به موارد زیر اشاره کرد.
مقیاس پذیری: مدلهای زبانی کوچک به دلیل حجم و اندازه کمتر، ذاتاً مقیاس پذیرتر از مدلهای بزرگ هستند. به بیان دیگر، میتوان چنین مدلهایی را به طور مستقیم بر روی دستگاههایی مانند تلفنهای همراه هوشمند، تجهیزات متصل به اینترنت (IOT) و سایر سیستمهای دارای توان محاسباتی محدود مستقر کرد.
کارایی: بر اساس برآوردهای صورت گرفته، مدلهای زبانی کوچک به توان محاسباتی کمتری نیاز دارند. امری که به معنای مصرف انرژی کمتر و زمان پردازش کوتاهتر است و همین ویژگی آنها را برای کاربردهای سریع و آنی به گزینهای ایده آل بدل میکند.
مقرون به صرفه بودن: در مدلهای کوچک زبانی، نیازهای محاسباتی کمتر به معنای کاهش هزینههای مربوط به پردازش و ذخیره سازی دادهها است. همین امر مدلهای مذکور را به یک راهکار مقرون به صرفه برای بسیاری از مشاغل و توسعه دهندگان تبدیل میکند.
دسترسپذیری: از سوی دیگر، مدلهای مذکور با کم کردن نیاز به منابع، موانع دسترسی به هوش مصنوعی مولد را کاهش میدهد و به سازمانها و افراد کوچکتر اجازه میدهد که استفاده از هوش مصنوعی را توسعه داده و این فناوری را بیش از پیش به کار گیرند.
امکان سفارشی سازی: با توجه به اندازه مدلهای زبانی کوچک، این ابزار فناورانه را میتوان به راحتی برای کارهای یا صنایع خاص در مقایسه با همتایان بزرگتر خود تنظیم و سفارشیسازی کرد.
تأثیرات زیست محیطی: مدلهای زبانی کوچک با کاهش ردپای کربن در قیاس با راهاندازی و اجرای مدلهای هوش مصنوعی در مقیاس بزرگ به چشم انداز هوش مصنوعی پایدارتر و دوستدار محیط زیست کمک میکنند.
حفظ حریم خصوصی دادهها: مدلهای کوچک زبانی با پردازش دادهها به صورت محلی در دستگاهها، حریم خصوصی را افزایش میدهند زیرا دادهها برای پردازش نیازی به ارسال به فضای ابری ندارند و در نتیجه خطر قرار گرفتن در معرض نقض دادهها کاهش مییابد.
کاربردهای شاخص مدلهای کوچک زبانی
قابلیتهای ذکر شده در توصیف مدلهای کوچک زبانی، امکان استفاده از این فناوری را در طیف گستردهای موارد و تجهیزات الکترونیکی میسر میسازد. در این بخش به بررسی برخی از کاربردهای کلیدی این مدلها میپردازیم.
برنامههای تلفن همراه: مدلهای کوچک زبانی میتوانند چتباتهای درون برنامه، ترجمه همزمان زبانهای گوناگون و دستیارهای صوتی هوشمند را مستقیماً در دستگاههای تلفن همراه گنجانده و تقویت کنند.
فناوری پوشیدنی: ویژگیهای این مدلها، آنها برای ادغام در دستگاههای پوشیدنی برای نظارت بر سلامت، ارائه بینشها و هشدارهای بلادرنگ بر اساس گفتار یا ورودی متن کاربر به ابزاری ایدهآل تبدیل میکند.
دستگاههای اینترنت اشیا: به عقیده کارشناسان، ادغام مدلهای زبانی کوچک با اینترنت اشیا، میتواند سیستمهای اتوماسیون خانگی و صنعتی هوشمندتر را با پردازش دستورات و اطلاعات به صورت محلی فعال کند.
محاسبات لبه: مدلهای کوچک زبانی در محیطهای محاسبات لبه ای بسیار مهم و حیاتی هستند؛ جایی که پردازش باید در نزدیکی منبع جمع آوری دادهها انجام شود تا زمان پاسخگویی بهبود و استفاده از پهنای باند کاهش یابد.
چالشهای مدلهای کوچک زبانی
با وجود همه مزایای ذکر شده برای مدلهای کوچک زبانی، توان و قدرت پردازش کمتر آنها، برخی معایب نیز در بر دارد. که از جمله آنها میتوان به موارد زیر اشاره کرد.
محدودیتهای عملکرد: در حالی که مدلهای زبانی کوچک در بسیاری از موارد کارآمد و توانمند هستند، اما معمولاً دقت و قابلیتهای مدلهای بزرگتر را ندارند. از همین روی ممکن است این ویژگی کاربرد آنها را در سناریوهای پیچیده محدود کند.
خطر بروز سوگیری و ارائه اطلاعات غلط: مجموعه دادههای کوچکتری که برای آموزش این مدلها استفاده میشوند ممکن است چندان متنوع نباشند و همین امر به طور بالقوه منجر به نتایج مغرضانه یا کاهش بیطرفی در فرآیندهای تصمیمگیری میشود.
پیچیدگی فرایند توسعه: متعادل کردن اندازه، کارایی و عملکرد در فرایند توسعه مدلهای زبانی کوچک میتواند چالش برانگیز باشد و ممکن است به رویکردهای جدید در معماری مدل و تکنیکهای آموزشی نیاز داشته باشد.
آینده مدلهای زبانی کوچک
پیشرفتهای فناورانه بدیع در تکنیکهای فشردهسازی مدلهای هوش مصنوعی و فرایندهای یادگیری میتواند بسیاری از محدودیتهای فعلی مدلهای زبانی کوچک را برطرف کند. به عقیده بسیاری از کارشناسان، ادامه تحقیق و نوآوری در این حوزه، احتمالاً توانایی مدلهای مذکور را افزایش میدهد و آنها را حتی در مقام رقابت با مدلهای بزرگتر قرار میدهد. علاوه بر این، با افزایش آگاهی و درک پتانسیل این مدلهای زبانی، ادغام آنها در بخشهای مختلف نیز افزایش مییابد.
به عقیده طیف گستردهای از کارشناسان، میتوان مدلهای زبانی کوچک را گام بلند بعدی در انقلاب هوش مصنوعی دانست.
سخن پایانی
به جرئت میتوان مدعی شد که مدلهای زبانی کوچک نشان دهنده یک پیشرفت امیدوارکننده در زمینه حوزه هوش مصنوعی مولد هستند. آنها با ایجاد تعادل بین عملکرد و کارایی، مزایای هوش مصنوعی را به نقاطی که قبلاً به دلیل محدودیت منابع محدود شده بودند، گسترش میدهند. با پیشرفت فناوری، مدلهای کوچک زبانی نقشی اساسی در فراگیر کردن هوش مصنوعی ایفا، نوآوری را در بسیاری از بخشها هدایت و دوره جدیدی از برنامههای کاربردی هوشمند را آغاز میکنند؛ دورهای که فراگیرتر و پایدارتر از هر زمان دیگری است.
همان طور که این مدلها به تکامل خود ادامه میدهند، احتمالاً به چشمانداز فناوری روزمره ما تبدیل میشوند و انقلاب هوش مصنوعی را به روشهایی به پیش میبرند که در حال حاضر مدت زیادی از درکشان توسط بشر نگذشته است.
توسعه و ادغام این ابزار فناورانه پتانسیل بازتعریف صنایع، بهبود زندگی شخصی و حرفهای و هموار کردن راه را برای آیندهای فراهم میکند که در آن هوش مصنوعی واقعاً همه جا حاضر و با نیازها و ارزشهای انسانی همسو است. با این وجود، سفر جهان در مسیر توسعه مدلهای زبانی کوچک تازه شروع شده است و تأثیر کامل آنها بر آینده هنوز دارای نقاط ابهام بسیاری است.