|

Görme engelliler için yapay zeka ile video sesli betimleme özelliği devrede

 

Bu içerikte, görme engelliler için video içeriğini erişilebilir hale getiren Microsoft Seeing AI’nin yapay zeka destekli sesli betimleme özelliği test edilerek, bu teknolojinin sunduğu avantajlar ve mevcut sınırlamaları değerlendiriliyor.

 

Görme engellilerin video içeriklerinde karşılaştığı erişilebilirlik sorunları

Günümüzde insanlar günlük yaşamlarında önemli bir zaman dilimini video izlemeye ayırmaktadır. İzlenen içerikler film, dizi veya sosyal medya gönderileri gibi çeşitli türlerde olabilir. Ancak burada önemli bir soru ortaya çıkmaktadır: Görme engelli bireyler videoyu izler mi yoksa dinler mi? Bu konu yalnızca Türkiye’de değil, dünya genelinde tartışılan bir meseledir. Geleneksel anlamda video, gözle takip edilmesi gereken bir içerik olduğu için görme engelli bireylerin bu içeriği dinlemeleri gerektiği düşünülmektedir. Ancak, izleme ve seyretme kavramlarını daha geniş bir perspektiften ele alırsak, aslında görme engellilerin de videoları izlediğini söyleyebiliriz. Buradaki en büyük engel, videoda akan karelerin içeriğinin yalnızca sesle anlaşılamaması ve görsel detayların eksik kalmasıdır. Bu sorunun çözümü için sesli betimleme geliştirilmiştir.

 

Görme engelliler için sesli betimleme nedir?

Sesli betimleme, bir dış sesin videodaki görsel unsurları açıklaması yoluyla, görme engelli bireylere video içeriğini anlama imkanı sunan bir yöntemdir. Günümüze kadar bu iş, insanlar tarafından yapıldı; yani bir kişi önce videoyu izledi, ardından detaylarını sesli olarak anlattı.

 

Yapay zeka ile video sesli betimlemesi

Ancak son dönemde yapay zeka bu alanda devreye girmiştir. Microsoft’un geliştirdiği “Seeing AI” isimli yapay zeka destekli uygulama, videoların görsel içeriklerini otomatik olarak betimleyerek erişilebilirliği artırmayı hedeflemektedir. Bu yapay zeka destekli video betimleme sistemini test etmek amacıyla, Emre Taşgın daha önce Anadolu Medeniyetleri Müzesi’nde çektiği bir kısa videoyu incelemektedir.

Yapay zeka destekli betimleme, videoda gerçekleşen eylemleri detaylı bir şekilde açıklamaktadır. Örneğin, kişi bir tahta bloğa baskı yapmak için bir alet kullanmaktadır. Alet, tahta blok üzerindeki bir öğeye yerleştirilmektedir. Kişi, aleti aşağıya doğru bastırarak işlem yapmaktadır. Daha sonra, alet kaldırılır ve ortaya çıkan nesne incelenir. Nihayetinde, kişinin küçük bir madeni parayı elinde tutarak kameraya yaklaştırdığı betimlenmektedir. Video, Microsoft’un yapay zekası tarafından betimlenmiştir.

 

Yapay zeka ile video sesli betimleme sınırlılıkları

Yapay zekanın sunduğu sesli betimlemenin bazı sınırlamaları da bulunmaktadır. Betimleme sırasında videonun durması ve her kareye ayrı bir açıklama yapılması, uzun videolar için yorucu bir deneyim yaratabilmektedir. Şu an için betimleme süreci, önce görselin tarif edilmesi ve ardından karelerin akması şeklinde ilerlemektedir. Ancak bu sistemin zamanla gelişmesi beklenmektedir.

 

Yapay zekanın görme engelli bireylerin yaşamına katkıları

Bu noktada, yapay zekanın görme engelli bireyler için sunduğu erişilebilirlik çözümlerinin henüz bir başlangıç olduğu ve gelecekte daha ileri seviyelere ulaşacağı vurgulanmaktadır. Bu tür teknolojik çözümler görme engelli bireylerin günlük yaşamlarını daha erişilebilir hale getirmekte ve onlara bilgiye daha kolay ulaşma imkanı tanımaktadır.

Paylaş: