|

Be My Eyes yapay zeka ile fotoğraf betimliyor – Erişilebilir deneyimler

 

Erişilebilir Deneyimler video serisinin her bölümünde, bir uygulamanın, ürünün veya hizmetin nasıl erişilebilir olarak kullanıldığını uygulamalı olarak göstereceğim. Bu sayfada ilk videomu izleyebilir ve videoya ait yazılı dökümü görüntüleyebilirsiniz.

 

Yazılı döküm

Merhabalar değerli arkadaşlar,

Kanalımın ikinci videosuyla sizlerle birlikteyim. Pazar günlerini erişilebilirliğe ayırmayı düşünüyorum birinci yayın dönemi için. Farklı serilerde erişilebilirliği çeşitli yönlerden ele alacağımız programlar yapacağım. İlk seri yayınımız “Erişilebilir deneyimler”.

Erişilebilir deneyimler serisinin birinci bölümünde ise Be My Eyes uygulamasına yakından bakacağız. Be My Eyes, görme engellilerin ihtiyaç duyduklarında gören desteği alabildikleri bir uygulama. Siz evde yalnız yaşıyor olabilirsiniz. Herhangi bir konuda gören desteği almak istiyor olabilirsiniz. Be My Eyes uygulamasını açarsınız. Oradaki gönüllülere canlı olarak bağlanırsınız ve isteğinizi dile getirirsiniz. Örneğin hazır çorba yapmak istiyorsunuz; mantar çorbası var, ezogelin çorbası var, tavuk çorbası var. Bu ürünleri ayırmak için Be My Eyes uygulamasındaki gönüllüden destek alabilirsiniz. Kıyafetinizin rengini yine bu uygulamayla görebilirsiniz. Biz bir ekiple domino oynuyorduk. Taşlardan bir tanesini yere düşürdük. Aradık, taradık bulamadık. En sonunda Be My Eyes’a bağlandık. Gönüllü

kişi kamerayı “sağa git”, “sola git” diyerek yönlendirdi ve en sonunda taşı bulduk. Oyunumuza devam edebildik. Yani sınır çok fazla da yok.

Yapay zeka çağına geldiğimiz 2023 yılında Be My Eyes diyor ki, “Ben fotoğrafları Chat GPT altyapısını kullanarak betimleyeceğim.” Betimleme ne demek? Videolardaki ve resimlerdeki görsellerin ne olduğunu biz körler anlamakta zorlanıyoruz. Örneğin bir film oynuyor, görseller akıyor. Fakat biz onların ne olduğu anlatılmadığı zaman filmi %100 anlayamıyoruz. Sunum takip ediyoruz; fotoğraflar akıyor, “Bakın şurada şöyle fotoğraflar var” deniliyor ama detayları söylenmediği zaman biz yine o sunumun ne anlatmak istediğini anlamıyoruz. Sosyal medyada çok fazla fotoğraflar paylaşılıyor fakat onların betimlemesi olmadığı zaman bizler etkileşime geçmeye çok da fazla gönüllü olmuyoruz. Bu

yüzden arkadaşlarımız #KörlerBuradaGörseliAçıkla diye sosyal medya kampanyası düzenliyorlar. Ben bunu destekliyorum. İşte Be My Eyes, Chat GPT altyapısını kullanarak bunu yapay zeka ile betimlemeyi iddia eden uygulamalardan bir tanesi. Tek değil ama iddialı.

Bugünkü yayında Be My Eyes uygulaması bir fotoğrafı yapay zekayla ne kadar iyi betimliyor, onu deneyeceğiz. Ekrandaki fotoğraf 2 Eylül 2023 tarihine çekildi. Ben bu tarihte Eğitim İş Sendikası’nın Başkanlar Kurulu toplantısına katıldım ve kurulmakta olan Engelsiz Eğitim İş komisyonu hakkında bilgi verdim. Fotoğraf da o ana ait. Şimdi ekrandaki fotoğrafı Be My Eyes’a göndereceğim ve betimleme yapmasını isteyeceğim. iPhone kullanacağım. iPhone’da voiceover adlı ekran okuyucu yazılım var. Bu uygulama ekrandaki metinleri sese dönüştüren bir yazılım. Be My Eyes, şu anda bu uygulamayı sınırlı kişiye açtı, beta olarak hizmet veriyor. Ben de yakın zamanda geniş bir beta kullanıcısına açılan uygulamaya dahil oldum. Bu videodan hem görenler hem körler yararlanabilirler. Görenler bizim için betimlemenin ne ifade ettiği konusunda farkındalık sahibi olabilirler. Körler ise henüz beta kullanıcısı değillerse yapay zekanın nasıl betimleme yaptığı hakkında fikir sahibi olabilirler. Şimdi daha fazla uzatmadan fotoğrafımızı Be My Eyes’a gönderelim.

(Ekran okuyucu sesi duyuluyor)

Evet, Be My Eyes bir mesaj yazıyor diye ingilizce uyarı verdi. Bekliyoruz. Bekleme süresini kesmeyeceğim ki ne kadar sürede betimlenen gerçekleştiğini sizler de fark edebilirsiniz.

(Ekran okuyucu İngilizce betimleme yapıyor)

Evet, duyduğunuz gibi betimleme yapıldı ama İngilizce. Ne yapacağız peki? Biz bu metni kopyalayıp Google Translate üzerinden mi Türkçe’ye çevireceğiz? Hayır arkadaşlar. Bir yazı alanımız var.

(Ekran okuyucu sesi duyuluyor)

Ekrandan Braille girişini açtım. Gördüğünüz gibi yazı alanında Braille klavye açıldı. Biz her yerde Braille derken bunu da kastediyoruz işte.

Evet, “Türkçe betimler misin” dedim ve yine bekliyorum. “Lütfen bekleyin, Be My Eyes mesaj yazıyor” diyor. Yine bekliyoruz hala. Bekleme süresi değişebiliyor.

Betimleme: “Fotoğrafta bir konferans veya toplantı salonunda kürsüde duran bir adam görülüyor. Adam açık mavi bir gömlek giymiş ve bir mikrofona konuşuyor. Kürsünün üzerinde büyük harflerle EĞİTİM İŞ yazan ve  altında Türkçe başka metninler bulunan bir afiş var. Afişte ayrıca bir kalkan ve kitap içeren bir logo da bulunuyor. Adamın sağ tarafında dikey olarak asılı büyük bir Türk bayrağı var. Bayrağın yanında bir adamın ve çocuğun olduğu siyah beyaz bir fotoğraf bulunuyor. Odanın arka planı desenli bir duvar ve kürsünün sol tarafında bir masada dizüstü bilgisayar var.”

Evet, gayet iyi betimledi değil mi? Peki; bazı şeyler net değil sanki. İsterseniz aynı betimlemeyi daha detaylı yapmasını isteyelim. Bakalım bize ekstra şeyler sunabilecek mi?

(Ekran okuyucu sesi duyuluyor)

Bekliyoruz. “Daha detaylı betimler misin” dedim. Şu anda bekliyoruz.

Betimleme: “Fotoğrafta genç bir adam kürsüde duruyor ve mikrofona konuşuyor. Adamın saçları kısa ve koyu renkte. Açık mavi bir gömlek giymiş ve ciddi bir ifadeyle konuşuyor. Kürsünün üzerinde beyaz bir afiş var ve bu afişte kırmızı ve mavi renklerde bir logo bulunuyor.

Logoda bir kalkan kitap ve 2009 yazısı yer alıyor. Afişte büyük mavi harflerle EĞİTİM İŞ yazıyor ve altında altıncı dönem beşinci başkanlar kuruluna hoş geldiniz yazan kırmızı ve mavi metinler var. Adamın hemen sağ tarafında kırmızı zemin üzerine beyaz ay yıldız olan büyük bir türk bayrağı asılı. Bayrağın hemen yanında siyah beyaz bir fotoğraf var. Fotoğraf da profil görünümünde yaşlı…”

Yarıda kaldı. Sizler de Chat GPT ile yazışırken böyle yarıda kaldığına şahitlik etmiş olabilirsiniz. Ama bu da bir problem değil.

(Ekran okuyucu sesi duyuluyor)

Şimdi detaylı isteyince tabi mesajda yarıda kalabiliyor, şöyle yazdık: “Yarıda kaldı devam eder misin?” Yine bekleme sürelerini kesmiyorum Özellikle ki fikir sahibi olabilelim  hepimiz diye arkadaşlar.

Betimleme: “Özür dilerim, devam ediyorum. Fotoğrafta profil görünümünde yaşlı bir adam ve ona bakan küçük bir kız çocuğu var. Yaşlı adamın takım elbise giydiği ve çocuğun koyu renk bir kıyafet giydiği görülüyor. Kürsünün sol tarafında bir masada açık bir dizüstü bilgisayar var. Masa kürsüye yakın ve bilgisayarın ekranı kürsüye dönük. Salonun arka planı desenli mavi bir duvar ve dikey çizgili panellerle kaplı. Duvarın sol tarafında, kürsünün arkasında büyük bir kapalı kapı bulunuyor. Genel olarak fotoğraf, bir konferans veya toplantı salonunda çekilmiş gibi görünüyor ve adamın bir sunum yaptığı veya konuşma yaptığı anlaşılıyor.”

Bu daha detaylı oldu değil mi arkadaşlar? O mikrofona ciddi şekilde konuşan genç adam ben oluyorum. Bu arada teşekkür ediyorum beni genç adam olarak betimlediği için Be My Eyes’a ve kullandığı Chat GPT’ye😊. Yaşlı adam dediği de arkadaşlar Atatürk oluyor.

Peki gören arkadaşlara soralım; bu iki betimleme sizce nasıl? Doğru

mu? Detaylı mı? Siz olsanız böyle betimler miydiniz yoksa daha mı detaylı betimlerdiniz? Yoksa daha az mı bilgi verirdiniz? Kör arkadaşlara soralım, insan betimlemesine göre bu betimlemelerin farkları neler, benzerlikleri neler? Sizleri tatmin ettiğimi bu iki betimleme?

Ve son olarak gören abonelerimize tekrar seslenmek istiyorum: Evet, yapay zeka betimleme yapmaya başladı ama %100 verimli olmayabilir. O yüzden sizler sosyal medyada yaptığınız paylaşımlardaki fotoğraflara betimleme eklemeye devam edin. Her uygulamada alternatif Metin ekleme özelliği artık var. Böylelikle daha verimli ve erişilebilir etkileşim kurma şansımız olur.

Bu videoyu beğenerek, paylaşarak ve yorumlayarak kanalıma destek olabilirsiniz. Ayrıca

abone olursanız hem beni memnun edersiniz hem de sonraki videolardan anlık biçimde haberdar olma şansınız olur.

Bir Sonraki videoda görüşene kadar, kendinize iyi bakın…

Be My Eyes web sitesini görüntüleyin

Paylaş: