Delikli kartlardan klavyelere, farelerden dokunmatik ekranlara uzanan süreçte insan-bilgisayar etkileşimi büyük değişimler geçirdi ve bu değişimlerin her biri bilgisayarın gücünden yararlanmamızı daha da kolaylaştırdı.
En büyük değişim ise son 10 yıl içerisinde, yapay zekânın bir bilim kurgu hayali olmaktan çıkarak gündelik hayatımızdaki yerini almasıyla yaşandı. Makine öğrenmesindeki ilerlemeler ve örneklere bakarak kendi kendine öğrenebilen yapay zekâ algoritmaları sayesinde günümüzde artık Alexa, Siri, Cortana ve Google Asistan ile konuşabiliyor, üstüne üstlük sorularımıza cevap da alabiliyoruz.
Dijital asistan devrimi ve diğer sohbet arayüzlerinin arkasında makine öğrenmesinin, insan dilini bilgisayar komutlarına dönüştüren iki dalı olan doğal dil işleme (Natural Language Processing/NLP) ve doğal dil oluşturma (Natural Language Generation/NLG) yatıyor.
NLP ve NLG insanlarla bilgisayarlar arasındaki engelleri yıkarak hem birbirlerini anlamalarını ve birbirleriyle etkileşime girmelerini sağladı hem de insan zekâsına destek olarak, daha önce mümkün olmayan görevleri yerine getirmeye yönelik yeni fırsatlar doğurdu.
Nafile denemeler
Bilim insanları onlarca yıldır insanların bilgisayarlarla sesli komutlar aracılığıyla etkileşim kurmasını sağlamak için gayret ediyor. Bu çalışmaların ilk örneklerinden biri, MIT Yapay Zekâ Laboratuvarı tarafından 1960’larda geliştirilen ELIZA adlı dil işleme uygulamasıydı. ELIZA bir psikiyatrın davranışlarını taklit ediyor ve kullanıcılarla sohbet ediyor, onlara neler hissettiğini soruyor ve aldığı cevaplara uygun karşılıklar veriyordu.
ELIZA’yı, PARRY (1972) ve Jabberwacky (1988) takip etti. Bir diğer örnek ise 1970’lerde geliştirilen, oyuncunun uygulama arayüzüne “Lambayı ve kılıcı çantaya koy” benzeri cümleler yazarak komutlar verdiği interaktif bir macera oyunu olan Zork’tu.
Bu ilk sohbet arayüzlerinin sıkıntısı, uygulamaları çalıştıran yazılımların kural temelli olmasıydı. Yani, programcıların uygulamaya verilebilecek olası tüm komutları öngörmesi ve programa dâhil etmesi gerekiyordu. Bu yaklaşımın sorunu program kodlarının çok karmaşık hale gelmesi ve buna rağmen kullanıcıların sayısız ifade yönteminin çoğunu gözden kaçırmasıydı.Örneğin, hava durumunu merak eden bir insan bunu çeşitli şekillerde sorabilir: “Bugün hava nasıl?”, “Öğleden sonra yağmur yağacak mı?”, “Gelecek hafta güneşli mi olacak?”, “Yarın hava daha sıcak olacak mı?”. Bir insan açısından bu farklı şekillerde ifade edilmiş soruları anlamak ve cevap vermek çok basittir. Ancak kural temelli bir yazılım söz konusu olduğunda, her nüans için ayrı ve somut talimatlar vermek gerekir. Bunu yaparken de yazım hatalarını vb.’yi de dikkate almanız şarttır.
Bütün bu farklı senaryoları hesaba katmak için gereken büyük zaman ve enerji, sohbet uygulamalarının uzun süre boyunca hız kazanmasına engel oldu. Zaman içerisinde butonlar ve açılır menülerden oluşan katı grafik arayüzlere alıştık ve uygulamanın önceden tanımlanmış komutlarının dışına çıkmaya kalkışmadık. Yani biz onların dilini öğrenmek zorunda kaldık. Şimdi ide durum değişiyor. Bilgisayarlar bizim dilimizi öğreniyor.
Sorun çözülüyor
NLP insan dilini akıllı bir şekilde analiz etmek amacıyla makine öğrenmesi ve derin öğrenme algoritmalarını kullanır. Makine öğrenmesi önceden tanımlanmış kurallar çerçevesinde gerçekleşmez. Bunun yerine, makine örneklere bakarak kendi kendine öğrenir. NLP örneğinde, makine öğrenmesi algoritmaları, insanlar tarafından etiketlendirilmiş binlerce, hatta milyonlarca metin, sözcük, cümle ve paragrafı inceler. Bu inceleme sonucunda, insan dilinin genel bağlamı konusunda bir fikir edinir ve bu bilgiyi gelecekte karşılaşacağı metinleri yorumlamakta kullanır.
Bu model NLP yazılımlarının insan dilindeki nüansların anlamını, programcı tarafından açıklanmasına gerek kalmadan çözmesini sağlar. NLP algoritmaları, yeterli eğitimi almaları durumunda, konuşma ve yazı dilini rahatlıkla anlayabilir, farklı anlamlara gelebilen bir sözcüğün hangi anlamıyla kullanıldığını çözebilir.
Örneğin, konuşmanın bağlamı çerçevesinde, bulut sözcüğünün bulut bilişim anlamında mı yoksa havadaki bulut anlamında mı kullanıldığını bilebilir. Hatta niyetinizi ve duygularınızı da çözebilir, bir soruyu hayal kırıklığı mı yoksa kafa karışıklığı içinde mi sorduğunuzu ayırt edebilir.
Kullanım alanları
Dijital asistanlar NLP’nin kullanım alanlarından sadece biridir. Bir diğer kullanım alanı da veritabanı taramasıdır. Bunların yanı sıra NLP’nin insanların çabalarına yardımcı olduğu birçok alan daha vardır.
Bunun örneklerinden biri, IBM Watson’un siber güvenlik amacıyla kullanımıdır. Watson NLP’yi her ay binlerce, yani herhangi bir uzman insanın okuyabileceğinden çok daha fazla siber güvenlik makalesi, raporu ve araştırmasını okumak için kullanır. Okuduğu bu yazılardan edindiği bilgileri, yeni olası tehditler hakkında fikir geliştirmek ve müşterilerini bu tehditlerden korumanın yollarını bulmak amacıyla kullanır.
NLP’nin yaygın bir şekilde kullanıldığı alanlardan biri dil çevirisidir. Girdiğimiz internet sitelerindeki dil değiştirme bölümleri ya da Google çeviri gibi hizmetler NLP’den oldukça yararlanır. NLP, dillerin yapısını çözümleyip dillerin anlaşılmasını ve yeniden üretilmesini sağlar. Google’ın çeviri hizmetlerinin 2016 yılında bir anda atılım yapması da NLP’nin gücü sayesinde olmuştur.
Diğer kullanım alanlarından biri de metinleri özetlemek, otomatik olarak etiketlendirmek ve bağlantılı yazıları göstermektir. Kimi şirketler NLP destekli yazılımları online içeriğin ve sosyal medya gönderilerinin duygusal çözümlemesi amacıyla kullanır. Bu sayede insanların ürün ve hizmetlerine nasıl tepkiler verdiklerini anlarlar.
NLP’nin önemli gelişim gösterdiği alanlardan biri de ELIZA’nın yapamadıklarını yapan sohbet robotları ya da yaygın kullanımıyla chatbot’lardır. Sağlık sektöründe kullanılan chatbot’lar hastalara sorular sorarak, gerçek doktorlar gibi teşhis koyabiliyor. Eğitim sektöründeki chatbot’lar ise kolay kullanımlı bir sohbet arayüzü aracılığıyla öğrencilere online ders verebiliyor.
İş dünyasında müşteri hizmetleri chatbot’ları teknolojiyi müşterilerin sorularını anlamak ve yanıtlamak amacıyla kullanıyor. Bu sayede insan çalışanlar daha karmaşık problemlerle ilgilenebiliyor. Örneğin, Nuance şirketi tarafından geliştirilen sanal asistan Nina’yı kullanan bir bankada hesap bilgileri, yeni hesap açma, en uygun vade benzeri temel sorular sanal asistanlar tarafından yanıtlanıyor. Daha karmaşık sorular karşısında ise Nina müşteriyi uygun yere yönlendiriyor.
Ayda 45.000 sanal sohbet
Swedbank örneği, NLP’nin gerçek hayatta ne işe yaradığını somut şekilde ortaya koyuyor. İsveç bankasının yaptığı bir araştırma, müşterilerin iletişim konusunda öncelikle aralarında chatbot’lar, e-posta ve sosyal medyanın da bulunduğu dijital kanallar olduğunu ortaya koydu. Müşteri hizmetlerinde gerçekleştirilen Nina entegrasyonu sayesinde müşterilerin sorularının yanıtlarını kendi kendilerine ve kolayca bulmalarını sağladı.
Üç ay içerisinde Nina müşterilerle ayda ortalama 30 bin etkileşim gerçekleştirmeye başladı. Arayanların yüzde 55’i, 350 farklı soruya yanıt verebilen Nina sayesinde sorularına cevap bularak, herhangi bir insanla iletişime girmeye gerek duymadan işlerini halletmeyi başardı.
Nina’yı başarıyla kullanan bir başka şirket de Coca Cola oldu. My Coke Rewards ve Ask Coca Cola sayfalarında Nina’dan yararlanan şirket, müşterileriyle ayda ortalama 45 bin “sanal” sohbet gerçekleştirdi. Bu sayede müşteri hizmetlerinin iş yükünde yüzde 40 azalma tespit edildi.
Sanal asistanları otomobillerimize de çoktan girdi. Dragon Drive adı verilen teknoloji sayesinde sürücüler navigasyon, müzik, mesajlaşma, takvim, hava durumu ve sosyal medya gibi uygulamaları sesli komutla yönetebiliyor.
Hem Anlıyor Hem Anlatıyor
Madalyonun öteki yüzünde ise NLG var. Gartner’a göre, “NLP metinlerden analitik fikirler elde etmek amacıyla kullanılırken, NLG ise analitik çıktıları belirli bir bağlama oturtulmuş hikâyelerle birleştirerek sentezlemek amacıyla kullanılıyor .”
Bir başka deyişle, NLP yazılımların insan dilini okumasını ve bilgisayarların anlayabileceği verilere dönüştürmesini sağlarken, NLG bilgisayarlar tarafından üretilmiş verilerin insanların anlayabileceği metinlere dönüşmesini sağlıyor.
NLG’nin gücünü, Google’ın birkaç yıl önce hayata geçirdiği, mektuplara sizin tarzınızda otomatik cevap veren uygulamada görebilirsiniz. NLG’nin ilgi çekici kullanım alanlarından biri de karmaşık verilere dair raporlar hazırlamaktır. Örneğin, NLG algoritmaları şirketin finansal verilerini ve tablolarını anlaşılır bir şekilde özetleyebilir. Bu sayede veri analistleri önemli bir zaman kaybından kurtulabilir.
Arkadaşım Siri
Başlangıçta insanlarla bilgisayarlar arasında devasa bir teknik mesafe vardı. Bu mesafe, NLP, NLG ve diğer yapay zekâ teknolojileri sayesinde hızla kapanıyor. Bilgisayarlarla arkadaşımızmış gibi konuşmaya giderek alışıyoruz.
Bir sonraki adım ne olabilir? Belki NLP ve NLG’nin pratik amaçlarla kullanımına odaklanılacak. Belki de bu teknolojiler, insanları kendine âşık edecek kadar gerçek makineler doğuracak. Her koşulda bizi heyecan verici gelişmelerin beklediği ortada.
En heyecan verici gelişmelerden biri de ses tanıma sistemleri. Yapay zekâ sistemleri sadece yazılı komutlarınızı değil, gündelik dille sesli olarak verdiğiniz komutları da anlayabiliyor.
Teknoloji sayesinde telefonlar iş takibinden, günlük planlamaya kadar hemen her alanda kullanabildiğiniz cihazlar haline geldi. Bu teknolojilerin en ilgi çekeni ise sanal asistanlar.
Gartner’ın araştırmalarına göre, Google ve benzeri mobil uygulamalar üzerinden sesli komutla arama yapanların sayısı hızla artıyor. comScore verilerine göre de 2020 yılı itibarıyla gerçekleştirdiğimiz aramaların yarısından fazlası sesli olarak gerçekleştirilecek.
ABD halkının yüzde 20’si, Alexa ve benzeri akıllı sistemlerden yararlanıyor, birçok işini sesli komutlarla hallediyor. Örneğin, Google’ın I/O konferansında tanıtımını gerçekleştirdiği asistan, sizin yerinize kuaförünüzü arayarak randevu alabiliyor.
Bu cihazların bizi her an “dinlemesi” birtakım mahremiyet kaygılarını da beraberinde getiriyor. Kural olarak bu kayıtlar sunuculara şifrelenmiş, yani güvenli bir şekilde iletiliyor. Ancak bir gazetecinin Google Home cihazında ortaya çıkardığı gibi, bazen yazılım hataları cihazın aktive edilmediği halde sizi dinlemesine de neden olabiliyor.
Bu yazılım hatalarına sisteminize uzaktan erişecek korsanlar da eklendiğinde tehlike daha da büyüyebilir. Şifrenize sahip herkes ne yaptığınızı öğrenebilir. Hatta Washington Post gazetesinin haberine göre, bir cinayet davasını çözmek amacıyla polis de bu yönteme başvurmuştu.
Amazon Echo gibi cihazlarda birilerinin sesli komut vererek sizin kart bilgilerinizle alışveriş yapması bile mümkün. Bu kişi konuğunuz ya da çocuğunuz olabilir. Hatta insan olmasına da gerek yok. Örneğin Mirror gazetesinin haberine göre bir papağan duyduklarını tekrar ederek Echo üzerinden hediye paketi siparişi verdi.
Pazar giderek büyüyor
Bu yazılımlar yeni beceriler de “öğrenebiliyor”. Bu sayede Alexa’nın banka hesabınızı ve fatura ödemelerinizi sizin yerinize kontrol etmesi mümkün hale geliyor. Apple, Google ve Microsoft da Amazon’un bu hizmeti benzeri hizmetler sunuyor. Mozilla tarafından 2017 yılında piyasaya sürülen Deepspeech benzeri açık kaynaklı ses tanıma kütüphaneleriyle kişisel asistanınızı tamamen kişiselleştirmeniz de mümkün hale geliyor.
Bu sayede bilgiye erişim yaygınlaşıyor ve demokratikleşiyor. “Son üç ayda gelir düzeyinde nasıl bir değişim yaşandı” sorusunun cevabını almak için ne yılların deneyimi ne de karmaşık yazılım bilgisi gerekiyor.
Google size yarın havanın nasıl olacağını şu anda söyleyebiliyor. İleride ise yolda yürürken müşterilerinizin neler hissettiğini, markanız hakkında neler düşündüğünü sorup öğrenebileceksiniz.
Tractica tarafından 2017 yılında yayınlanan bir rapora göre NLP yazılım, donanım ve hizmet pazarı 2021 yılında 16 milyar dolara, 2025 yılı itibarıyla 22,3 milyar dolara ulaşacak. 2016 yılında 136 milyon dolar büyüklüğe sahip olan yapay zekâ kullanan NLP yazılım çözümleri pazarı da 2025’te 5,4 milyar dolar büyüklüğe ulaşacak.
Tabii her teknoloji gibi bu teknoloji de kendine özgü siber riskleri beraberinde getiriyor. Örneğin, Kaspersky Laboratuvarı güvenlik uzmanı David Emm’e göre, kötü niyetli kişilerin sesle aktive edilen cihazlara erişebilmesi için, kısa bir ses örneğinize sahip olması yeterli olabiliyor.
Bu tehlikenin örnekleri medyada yer bulmaya başladı. Örneğin ABD’nin Oregon eyaletinde bir aile, Alexa’nın özel sohbetlerini kaydettiğini ve rehberlerindeki bir kişiye gönderdiğini tespit etti.
Yeni ufuklar
Sadece ses tanıma teknolojileri değil, görüntü işleme, hareket algılama gibi birçok sistemde de yapay zekâ teknolojileri giderek ilerliyor. Çünkü ne söylediğimiz kadar, bunu nasıl söylediğimiz de önemli. Yani o anki ruh halimiz.
Yazılı ya da sözlü konuşma dilini anlayan ve karşılık veren yapay zekâ sistemlerinin bir sonraki hedefi ise biyometrik verilerden kişiliğiniz ve ruh haliniz hakkında fikir edinmek.
Akıllı telefonlarda standart güvenlik uygulaması haline gelmeye başlayan yüz tanıma özelliği daha da gelişecek ve kullanım alanları yaygınlaşacak. Bir müşteri hizmetlerine bağlandığınızda, karşınızdaki robot sadece ağzınızdan çıkanları duymakla ve anlamakla kalmayacak, beden dilinizi de çözecek. Böylece öfkeli bir müşteri karşısında olduğunu anlayacak ve ona göre hareket edecek.
Bu konuda çalışmalar hızla ilerliyor. Henüz istenilen noktaya varılmamış olsa da, umut verici gelişmeler yaşanıyor. Almanya’daki Saarland Üniversitesinde görevli Alman ve Avustralyalı bilim insanları tarafından 2018 yılında gerçekleştirilen bir araştırmada, 42 gönüllüye, göz hareketlerini takip eden başlıklar takıldı. Sonuçları Frontiers in Human Neuroscience dergisinde yayınlanan “Eye Movements During Everyday Behavior Predict Personality Traits” (Gündelik Davranışlar Sırasındaki Göz Hareketleri Kişilik Özelliklerinin Öngörülmesini Sağlıyor) başlıklı araştırmada, bu başlıklar tarafından toplanan verilerin yapay zekâ sistemleri tarafından analizi sayesinde, kullanıcıların kişiliklerine dair, nörotisizm (sosyal ve psikolojik stresörlere olumsuz olarak tepki verme eğilimi olan anksiyete özelliği), dışadönüklük, açık görüşlülük, uyum, bilinçli davranma becerisi gibi alanlarda isabetli veriler ortaya çıkarıldı. Henüz yüzde 100 bir isabet sağlanamasa da, kamera görüntülerine bakarak tahminde bulunmanın çok ötesinde bir başarı elde edildi.
Bütün bunlar insansı bir robotta bir araya geldiğinde, işte o zaman insan makine etkileşiminde yeni bir çağ başlamış olacak. İnsan görünümlü bir robot sizi dinleyecek, anlayacak, neler hissettiğinizi bilecek ve uygun karşılığı, uygun mimik ve jestlerle verecek. Bilim kurgu gibi ama değil.
Kaynak: STM ThinkTech