مایکروسافت از مدلهای جدید هوش مصنوعی Phi-4 رونمایی کرد
به گزارش کارگروه فناوری اطلاعات سایبربان ؛ مایکروسافت از مدلهای جدید هوش مصنوعی Phi-4 رونمایی کرده که قادر به پردازش همزمان متن، تصویر و گفتار هستند و درعینحال به قدرت پردازشی کمتری نسبت به مدلهای مشابه نیاز دارند.
مدل Phi-4-Multimodal با 5.6 میلیارد پارامتر و مدل Phi-4-Mini با 3.8 میلیارد پارامتر، با وجود اندازه کوچکتر، عملکردی قابلرقابت با مدلهای دو برابر بزرگتر از خود ارائه میدهند. طبق گزارش فنی مایکروسافت، این مدلها در برخی از وظایف حتی از رقبای خود پیشی میگیرند.
پردازش همزمان متن، تصویر و گفتار با مدلهای جدید هوش مصنوعی مایکروسافت
ویژگی شاخص Phi-4-Multimodal توانایی پردازش چندوجهی آن است که به لطف تکنیک جدید «ترکیب LoRAs» امکانپذیر شده است. این رویکرد باعث میشود مدل بتواند بدون افت عملکرد، بهطور همزمان ورودیهای متنی، تصویری و صوتی را پردازش کند.
به گفته «ویژو چن»، معاون بخش هوش مصنوعی مایکروسافت، این مدلها به توسعهدهندگان کمک میکنند تا برنامههای نوآورانه و هوشمندتری ایجاد کنند. او تأکید کرد که Phi-4-Multimodal قابلیتهای پیشرفتهای را برای پردازش گفتار، تصویر و متن بهصورت همزمان فراهم میکند و افقهای جدیدی را در توسعه برنامههای مبتنی بر هوش مصنوعی باز میکند.
این مدل در رتبهبندی Hugging Face OpenASR برای تشخیص گفتار، با نرخ خطای 6.14 درصد جایگاه نخست را کسب کرده و حتی از سیستمهای تخصصی مانند WhisperV3 عملکرد بهتری نشان داده است.
بهطور کلی، عملکرد Phi-4-multimodal در زمینههای تشخیص گفتار، ترجمه، خلاصه سازی، درک صدا و تجزیهوتحلیل تصویر بهبود پیدا کرده است.
Phi-4-Mini: مدل کوچک، اما قدرتمند در ریاضیات و برنامهنویسی
مدل Phi-4-Mini نیز با وجود اندازه کوچک خود، توانایی بالایی در وظایف متنی دارد و طبق گزارش مایکروسافت، در بسیاری از آزمونهای هوش مصنوعی عملکردی مشابه یا برتر از مدلهایی که دو برابر بزرگتر هستند ارائه میکند.
این مدل در آزمون GSM-8K (معیاری برای سنجش توانایی مدلها در حل مسائل ریاضی) 88.6 درصد امتیاز کسب کرده که بالاتر از بسیاری از مدلهای 8 میلیارد پارامتری است. همچنین در آزمون MATH امتیاز 64 درصد را بهدست آورده که نسبت به مدلهای هماندازه خود اختلافی بیش از ۲۰ امتیاز دارد.
Phi-4-mini برای موقعیتهایی که در آنها به سرعت و کارایی نیاز است طراحی شده و توسعهدهندگان میتوانند از هر دو مدل روی گوشیهای هوشمند، رایانههای شخصی و خودروها استفاده کنند.
مایکروسافت با مدلهای Phi-4 نشان داده که در هوش مصنوعی، قدرت فقط به اندازه مدلها بستگی ندارد، بلکه بهینهسازی و کارایی نیز نقش مهمی دارند. این مدلها طوری طراحی شدهاند که روی سختافزارهای معمولی بدون نیاز به اتصال مداوم به فضای ابری اجرا شوند.
مایکروسافت این مدلها را از طریق Azure AI Foundry ،Hugging Face و Nvidia API Catalog در دسترس قرار داده تا توسعهدهندگان بتوانند بهراحتی از آنها در پروژههای خود استفاده کنند.