*ارتقای کیفیت شناسایی تصاویر در فیسبوک و اینستاگرام
از اضافه شدن فناوری شناسایی تصاویر به پستهای فیسبوک پنج سالی میگذرد. قابلیتی که بهطور خاص برای نابینایان طراحیشده است و کارش این است که عکسهایی را که کاربران در صفحات شخصیشان به اشتراک میگذارند، با چند کلمه ساده توصیف میکند. اما این قابلیت چیست و از کجا میآید؟
فیسبوک در سال ۲۰۱۶ توانست با استفاده از فناوری بینایی ماشین و تلفیق آن با هوش مصنوعی، برای عکسهایی که کاربران به اشتراک میگذارند، متنِ جایگزینِ خودکار اضافه کند. (AAT)، نام فناوری تازهای بود که فیسبوک در آن زمان به پلتفرم خود اضافه کرد. برای روشنتر شدن ماجرا بهتر است اول ببینیم «متن جایگزین عکس» دقیقاً چیست؟ فرض کنید وبسایتی را اداره میکنید و قصد دارید یک عکس را در آن با مخاطبانتان به اشتراک بگذارید. از طرفی برایتان مهم است که کاربران اینترنت با جستجو در گوگل هم بتوانند عکسی را که به اشتراک میگذارید پیدا کنند. در این صورت چطور میتوانید محتوای عکس را برای گوگل مشخص کنید؟ چاره کار در استفاده از «متن جایگزین تصویر» است. متنی که در صفحهنمایش داده نمیشود اما موتورهای جستجو نظیر گوگل میتوانند آن را بخوانند. استفاده از «متن جایگزین تصویر» علاوه بر بهینهسازی عکسها برای گوگل، یک کاربرد دیگر هم دارد و آن این است که صفحهنمایش میتوانند آن را بخوانند و بهاینترتیب، کاربر نابینا هم میتواند به کمک متنی که صاحب عکس نوشته از جزئیات عکس مطلع شود.
در سالهای اخیر شاهد بودیم که توییتر امکان نوشتن «متن جایگزین عکس» را در اختیار کاربران قرار داده است؛ اما تعداد کاربرانی که از این امکان استفاده میکنند و عکسهایشان را برای کاربران نابینا توضیحدار میکنند بسیار اندک است و عملاً میتوان گفت این قابلیت کمک چندانی به کاربران نابینا نکرده است. فیسبوک هم دقیقاً به همین علت، از مختار کردن کاربرانش برای نوشتن «متن جایگزین عکس» صرفنظر کرده و بهجای سپردن این وظیفه به خودِ کاربران، آن را به عهده فناوری «بینایی ماشینی» و «هوش مصنوعی» گذاشته است. این فناوری سه سال پیش در اینستاگرام هم تعبیه شده است. حالا فیسبوک جزئیات تازهای منتشر کرده که نشان از پیشرفت کیفیِ چشمگیر در این قابلیت دارد.
فیسبوک خبر میدهد از ۲۰۱۶ تاکنون تعداد اشیایی که میتواند در عکسها شناسایی کند، به ۱۲۰۰ شیء رسیده است. این یعنی ده برابر شدنِ اشیای قابل شناسایی در طول پنج سال. این شرکت همچنین گزارش داده حالا میتواند علاوه بر اشیا، حالتها، رفتارها یا برخی شرایط محیطی را هم شناسایی کند. بهعنوانمثال حالا فیسبوک میتواند تشخیص دهد کاربری در حال لبخند زدن است یا اخم کرده یا دستش را به سمتی دراز کرده است. فیسبوک همچنین میتواند مکان و چگونگی قرارگیری اشیا در یک عکس را هم به کاربر گزارش دهد؛ مثلاً حالا کاربر با جملاتی مثل این مواجه میشود که «پنج نفر در تصویر هستند که دو نفرشان در مرکز عکس و سه تا در حاشیههای عکس دیده میشوند.» فیسبوک وعده داده بهزودی امکانات و قابلیتهای بیشتری هم به این سرویس خواهد افزود. درصورتیکه فیسبوک بتواند محتوای عکسی را شناسایی کند، کاربران اندرید میتوانند با فشار طولانی بر روی عکس، جزئیات آن را بشنوند.
منبع : ایران سپید