یک مدل زبانی جدید که توسط محققان دانشکده علوم کامپیوتر دیوید آر. چریتون در دانشگاه واترلو (Waterloo) ایجاد شده است، رایانهها را قادر می سازد تا متنهای به زبانهای مختلف آفریقایی را برای بسیاری از کارها تجزیه و تحلیل کنند.
مدل جدید شبکه عصبی که محققان آن را AfriBERTa نامیدهاند، از تکنیکهای یادگیری عمیق برای دستیابی به نتایج پیشرفته برای زبانهای کم کاربرد استفاده میکند. مدل زبان عصبی به طور خاص با 11 زبان آفریقایی مانند آمهری، هاوسا و سواحیلی که به طور جمعی توسط بیش از 400 میلیون نفر صحبت میشوند، کار میکند. این مدل با وجود یادگیری فقط از یک گیگابایت متن، کیفیت خروجی قابل مقایسه با بهترین مدلهای موجود را به دست میدهد، در حالی که مدلهای دیگر به هزاران برابر داده بیشتری نیاز دارند.
باید افزود که این مدلهای زبانی از پیش آموزشدیده، روش پردازش و تجزیه و تحلیل دادههای متنی را برای کارهایی از ترجمه ماشینی تا پاسخ به سؤالات توسط رایانهها را تغییر داده است اما متأسفانه تا به امروز زبانهای آفریقایی کمتر مورد توجه قرار گرفته بود.
منبع