3 سال پیش

مدل جدید تبدیل متن به تصویر با کمک هوش مصنوعی

به تازگی شرکت OpenAI با استفاده از مدل GPT-3 نشان داد که یک مدل یادگیری عمیق را می‌توان به سادگی و با دادن مقادیر زیادی نوشته برای تبدیل متن به تصویر آموزش داد.

همچنین آن‌ها نشان دادند که با جایگزین‌کردن متن با پیکسل، می‌توان از همین روش برای آموزش هوش مصنوعی برای تکمیل تصاویر نیمه‌تمام استفاده کرد؛ GPT-3 چگونگی استفاده انسان از کلمات را تقلید می‌کند. همچنین Image GPT-3 آنچه را می‌بینیم پیش‌بینی می‌‌کند.

اکنون OpenAI دو مدل جدید به نام DALL · E و CLIP ساخته است که زبان و تصاویر را به گونه‌‌ای ترکیب می‌کند که هوش مصنوعی را در درک کلمه و آن‌چه که به آن اشاره می‌کنند یاری می‌کند.

ایلیا ساتسکور، دانشمند ارشد OpenAI می‌گوید:

ما در یک جهان بصری زندگی می‌کنیم. در طولانی مدت، شما مدل‌هایی خواهید داشت که متن و تصویر را درک می‌کنند و در نتیجه در تبدیل متن به تصویر موفق عمل خواهند کرد. هوش مصنوعی می‌‌تواند زبان را بهتر درک کند زیرا قادر است معنی کلمات و جملات را بفهمد

برخی اوقات خروجی GPT-3، می‌تواند از واقعیت دور باشد. محققان OpenAI و جاهای دیگر در تلاشند تا با قراردادن متن در تصاویر، به مدل‌های زبانی فهم بهتری از مفاهیم روزمره‌ای که انسان‌ها برای درک‌کردن استفاده می‌کنند بدهند.

در نگاه اول، (CLIP (Contrastive Language-Image Pre-Training یک سیستم شناسایی تصویر عادی است. با این تفاوت که این سیستم مانند دیگر مدل‌های موجود برای شناسایی تصاویر از نمونه‌های برچسب دار موجود در پایگاه داده استفاده نمی‌کند؛ بلکه از تصاویر موجود در اینترنت و عناوین آن‌ها استفاده می‌کند. در این روش مدل به جای اینکه از یک برچسب یک کلمه‌ای مانند “گربه” یا “موز” به تصویر پی ببرد از توصیف آنچه در تصویر است آن را می‌آموزد.

مارک ریدل، که در حوزه پردازش زبان طبیعی و خلاقیت محاسباتی در انستیتوی فناوری جورجیا در آتلانتا کار می‌کند می‌‌گوید:

تبدیل متن به تصویر یک چالش تحقیقاتی است که مدت‌هاست وجود داشته است. اما این یک نمونه قابل توجه است

برای آزمایش توانایی DALL · E در کار با مفاهیم نو، محققان عنوان‌هایی را به مدل دادند که توصیف ‌کننده اشیائی بود که مدل تا پیش از این با آ‌ن‌ها آشنا نبوده است. مانند “صندلی آووکادو” و “تصویری از تربچه در حال راه رفتن با یک سگ” که در هر دو مورد، هوش مصنوعی تصاویری ایجاد کرد که این مفاهیم را به روش‌های قابل قبولی تلفیق می‌کرد.

منبع: technologyreview

برچسب‌ها

لینک مطلب:

[post-pretty-link][post-pretty-link]

کپی شد

دیدگاهتان را بنویسید لغو پاسخ

مطالب پر بازدید

اولین روز کاری پس از هاوینگ با رشد سهام شرکت‌های حوزه کریپتو همراه بود

فاطمه وفایی

4 اردیبهشت 1403

روز دوشنبه، دو روز پس از هاوینگ بیت کوین، سهام شرکت‌های مرتبط با کریپتو در…

شکایت از بایننس در کانادا به دلیل نقض قوانین اوراق بهادار

فاطمه وفایی

4 اردیبهشت 1403

بایننس با یک شکایت دسته جمعی جدید در کانادا مواجه شده‌است. شاکیان آن ادعا می‌کنند…

بازار بورس نیویورک در حال بررسی راه‌اندازی معاملات ۲۴ ساعته مثل فضای کریپتو است

فاطمه وفایی

4 اردیبهشت 1403

بازار بورس نیویورک (NYSE) در حال بررسی این است که آیا معامله‌گران از معاملات 24…

درخواست بایدن از کنگره آمریکا برای نابودی صنعت ماینینگ آمریکا

فاطمه وفایی

4 اردیبهشت 1403

جو بایدن، رئیس جمهور آمریکا، از کنگره این کشور خواسته تا صنعت ماینینگ بیت کوین…

استعفای دو تن از وکلای SEC پس از محکومیت این سازمان به «سوءاستفاده فاحش» از قدرت در یک پرونده کریپتو

فاطمه وفایی

4 اردیبهشت 1403

بر اساس گزارش‌ها، دو وکیل کمیسیون بورس و اوراق بهادار ایالات متحده (SEC) پس از…

شیبا اینو در یک جذب سرمایه جدید 12 میلیون دلار جمع‌آوری کرده است

فاطمه وفایی

4 اردیبهشت 1403

شیبا اینو (Shiba Inu) 12 میلیون دلار از طریق پیش‌فروش یک توکن خصوصی مدیریتی و…

رویترز: ونزوئلا برای فروش نفت از تتر استفاده می‌کند

فاطمه وفایی

4 اردیبهشت 1403

به گزارش خبرگزاری رویترز، شرکت ملی نفت ونزوئلا (PDVSA) در تلاش است تا با استفاده…

برزیل استفاده از ارزهای دیجیتال در هر گونه قماری را ممنوع کرد

بهزاد عمرانی

3 اردیبهشت 1403

برزیل استفاده از ارز دیجیتال و تقریباً اکثر روش‌های دیگر پرداخت را برای مقاصد قمار…

همکاری منچستر سیتی با صرافی اوکی‌اکس برای عرضه تیشرت‌های فوتبالی قابل تبدیل به NFT

همکاری منچستر سیتی با صرافی اوکی‌اکس برای عرضه NFT

بهزاد عمرانی

3 اردیبهشت 1403

صرافی ارز دیجیتال اوکی‌اکس (Okx) و باشگاه فوتبال انگلیسی منچستر سیتی یک سری تیشرت‌های فوتبال…

دادگاهی مهم برای ریپل و SEC فردا برگزار می‌شود

بهزاد عمرانی

3 اردیبهشت 1403

اختلاف حقوقی بین ریپل و کمیسیون بورس و اوراق بهادار ایالات متحده (SEC) با گذشت…

تایلند دسترسی به پلتفرم‌های ارز دیجیتال غیر مجاز را مسدود می‌کند

بهزاد عمرانی

3 اردیبهشت 1403

بر اساس اطلاعیه‌ای که روز جمعه منتشر شد، مقامات تایلند تصمیم گرفته‌اند پلتفرم‌های ارز دیجیتال…

شروع کمپین جمع‌آوری 100 هزار امضا برای تبدیل بیت کوین به ارز ذخیره سوئیس

فاطمه وفایی

3 اردیبهشت 1403

چندین فرد تأثیرگذار طرفدار بیت کوین مستقر در سوئیس در حال تلاش برای الزام بانک…

افت شدید کارمزدهای شبکه بیت کوین پس از اوج‌گیری در پی هاوینگ

فاطمه وفایی

3 اردیبهشت 1403

میانگین کارمزدهای پرداختی در شبکه بیت کوین تنها یک روز پس از رسیدن به میانگین…

همکاری تتر با یک استارت‌آپ بلاکچینی در نیجریه

بهزاد عمرانی

2 اردیبهشت 1403

ایووری‌پی (Ivorypay)، یک استارت‌آپ مستقر در نیجریه‌ و متخصص در پرداخت‌ها و حواله‌های مبتنی بر…

تحلیلگران مطرح: ETF های اتریوم در ماه می مجوز نخواهند گرفت

بهزاد عمرانی

2 اردیبهشت 1403

تحلیلگران برتر بازار صندوق‌های قابل معامله بورسی کریپتو معتقداند که امتناع کمیسیون بورس آمریکا (SEC)…

سم بنکمن فرید به توافقی برای همکاری در شکایت علیه سلبریتی‌ها رسیده است

بهزاد عمرانی

2 اردیبهشت 1403

مدیر عامل سابق صرافی FTX، سم بنکمن فرید، با سرمایه گذاران توافق کرده‌است و همکاری…

گری‌اسکیل یک ETF بیت کوین «مینی» با ده برابر کارمزد کمتر از GBTC عرضه خواهد کرد

بهزاد عمرانی

2 اردیبهشت 1403

شرکت گری‌اسکیل (Grayscale Investments) اعلام کرده است که نسخه “مینی” از صندوق قابل معامله بورسی…

دادگاه فرار مالیاتی بایننس در نیجریه به 17 می منتقل شد

بهزاد عمرانی

2 اردیبهشت 1403

محاکمه فرار مالیاتی در نیجریه برای صرافی ارز دیجیتال بایننس و دو تن از مدیران…

کمیسیون بورس آمریکا اتهامات جدیدی علیه جاستین سان مطرح کرده است

بهزاد عمرانی

2 اردیبهشت 1403

کمیسیون بورس و اوراق بهادار آمریکا (SEC) شکایت خود را علیه بنیان‌گذار شبکه ترون، جاستین…

برای اولین بار کارمزد شبکه بیت کوین به بالای صد دلار رسید

فاطمه وفایی

1 اردیبهشت 1403

میانگین کارمزد تراکنش‌های بیت کوین برای اولین بار در 20 آوریل، پس از رویداد هاوینگ،…

مدل جدید تبدیل متن به تصویر با کمک هوش مصنوعی

دیدگاهتان را بنویسید لغو پاسخ

ایرانیتال ، یک ایران دیجیتال