شرکت فیسبوک بالاخره ابزار مورد نیاز برای دیدن تصاویر توسط نابینایان را در اختیار کاربران نسخه iOS اپلیکیشن خود قرار داده است.
به گزارش ایران سپید فیسبوک به تازگی ابزاری به نام Automatic Alternative Text را برای افراد نابینا و کم بینا عرضه کرده است که امکان دیدن تصاویر در این شبکه اجتماعی را برای این افراد مهیا میکند. ابزار ATT به افرادی که تا به امروز برای تشخیص محتوای به اشتراک گذاشته شده در فیسبوک از نرم افزارهای "صفحه خوان" استفاده میکردند امکان میدهد تا از یک فناوری تشخیص تصویر جدید استفاده کرده و بتوانند توضیحات مفیدتری را درباره تصاویر منتشر شده در فیسبوک داشته باشند. این ابزار که توسط تیم دسترسپذیری فیسبوک مدیریت میشود، از ماهها پیش در دست طراحی بوده است.
مت کینگ اولین مهندس نابینای فیسبوک در این زمینه می گوید: "به عنوان یک فرد نابینا همواره به این فکر میکنم که چه میزان از فید خبری فیسبوک من، تصویری است و میدانم که بخش عمدهای از این فید را تصاویر تشکیل میدهند. کاربران اغلب درباره تصویری که منتشر میکنند، یک عبارت توصیفی مینویسند و زیر این تصویر کامنتهای مختلفی گذاشته میشود، اما هیچ یک از کاربران به شما نمیگویند که دقیقا چه چیزی در این تصویر دیده میشود. به این ترتیب برای فردی با شرایط من این سوال پیش می آید که اوضاع از چه قرار است و این افراد دقیقا درباره چه چیزی حرف میزنند؟"
قبل از عرضه ATT کاربران از نرم افزارهای صفحه خوان استفاده میکردند، سرویسهایی که تنها نام فردی که تصویر را منتشر کرده و توضیحی که فرد زیر آن تصویر نوشته بود را برای افراد نابینا یا کم بینا میخواندند. اکنون با استفاده از ATT کاربران میتوانند هر آنچه در تصویر وجود دارد برای مثال حضور سه نفر، لبخند این افراد و حضور آنها در محیط بیرونی را ببینند.
فناوری تشخیص اجسام که سیستم ATT فیسبوک از آن استفاده میکند مبتنی بر یک شبکه عصبی شامل میلیاردها پارامتر است که توسط میلیونها مثال آموزش دیده است. شبکههای عصبی یکی از مدلهای یادگیری ماشینی هستند. زمانی که حرف از تصاویر در میان باشد، شما میتوانید به یک شبکه عصبی به عنوان یک سیستم تشخیص الگو نگاه کنید.
فناوری مورد استفاده در ATT فیسبوک میتواند تصاویر و کلمات را در حمل و نقل (خودرو، قایق، موتورسیکلت)، طبیعت (محیط بیرونی، کوهستان، موج دریا، خورشید، چمن)، ورزش (تنیس، شنا، استادیوم)، غذا (بستنی، سوشی، دسر) و لغات توصیفی برای ظاهر (کودک، عینک، لبخند زدن، جوهرات، سلفی) را تشخیص دهد.
این فناوری در حال حاضر تنها برای صفحه خوانهای iOS که به زبان انگلیسی تنظیم شدهاند، عرضه شده است زیرا این طیف از کاربران نابینا و کم بینا در حال حاضر بیشترین استفاده از فیسبوک را دارند.