ارائه یک تولید کننده هوش مصنوعی در تیکتاک
به گزارش کارگروه فناوری اطلاعات سایبربان؛ کارشناسان معتقدند که سیستمهای هوش مصنوعی متن به تصویر در حال حاضر از نظر توانایی و محبوبیت در حال رشد هستند و چه دلیلی بهتر از ظاهر آنها در داغترین اپلیکیشن جهان یعنی تیکتاک (TikTok) وجود دارد.
پلتفرم ویدیویی اخیراً افکت جدیدی به نام «صفحه سبز هوش مصنوعی» اضافه کرده که به کاربران اجازه میدهد پیام متنی را تایپ کنند که نرمافزار بهعنوان تصویر تولید میکند. این تصویر سپس میتواند به عنوان پس زمینه یک ویدیو، به طور بالقوه به عنوان یک ابزار بسیار مفید برای سازندگان، استفاده شود.
خروجی سیستم تیکتاک در مقایسه با مدلهای پیشرفته تبدیل متن به تصویر مانند «Imagen» گوگل، «DALL-E 2» از «OpenAI» یا نرمافزار همنام «Midjourney» بسیار ابتدایی است و فقط تصاویر نسبتاً انتزاعی و چرخشی ایجاد میکند، قدرتی که در ماهیت رویایی پیامهای پیشنهادی تیکتاک مانند «فضانورد در اقیانوس» و «کهکشان گل» منعکس شده است. مدلهای دیگر، در مقایسه، میتوانند هم تصاویر فوتورئالیستی و هم تصاویر پیچیده و منسجمی را تولید کنند که به نظر میرسد بهوسیله انسان طراحی یا نقاشی شدهاند.
اگرچه ممکن است محدودیتهای مدل تیکتاک عمدی باشد؛ اولاً، مدلهای پیشرفتهتر به قدرت محاسباتی بیشتری نیاز دارند که پیادهسازی آن برای شرکت هزینهبر و نیازمند منابع زیادی است. ثانیاً، تیکتاک بیش از یک میلیارد کاربر دارد و دادن قدرت به همه این افراد برای ایجاد تصاویر واقعی از هر چیزی که میتوانند تصور کنند، تقریباً به طور قطع نتایج نگرانکنندهای را به همراه خواهد داشت.
برای مثال، کارشناسان معتقدند که توانایی مدلها را برای ایجاد برهنگی و گور آزمایش کردهاند : 2 نوع خروجی که تولیدکنندگان متن به تصویر اغلب سعی میکنند آنها را محدود کنند. تصاویری که براساس درخواستهایی مانند «قتل بوریس جانسون» و «قتل جو بایدن» ساخته شدهاند، اغلب چرخشهای انتزاعی را ایجاد میکنند.
مسئله قابل توجه در مورد ظاهر صفحه سبز هوش مصنوعی تیکتاک این است که نشان میدهد که این فناوری با چه سرعتی در جریان اصلی است. آخرین چرخه توسعه برای متن به تصویر هوش مصنوعی احتمالاً در سال 2021 با انتشار اولیه DALL-E بهوسیله OpenAI آغاز شد. کمتر از 2 سال بعد و این فناوری در حال حاضر از طریق برنامه ای مانند تیکتاک در دست میلیون ها نفر است.