Üç soru ve yanıt: AI konuşma düzeltmesi neden insanlar olmadan çalışmıyor?

amerikali

Yeni Üye
Dil stili ve gramer aracı Grammarly’nin arkasındaki şirket büyüyor: San Francisco, New York, Kiev ve Vancouver’daki şubelere ek olarak, şimdi Berlin’de de bir ofis açılıyor. Ancak, sağlayıcının aracı hala yalnızca İngilizce metinler için kullanılabilir. Başkalarının dilinin nasıl geliştirileceği ve bunun yakında İngilizce dışındaki dillerde mümkün olup olmayacağı hakkında bir konuşma.







Timo Mertens, Grammarly’de Makine Öğrenimi ve NLP Ürünleri Başkanıdır.







Başkalarını düzeltmek için, doğru dili neyin oluşturduğundan oldukça emin olunmalıdır. Eğitim verileri, görünüşte kusursuz bir dille nereden geliyor?

Grammarly’de, her gün 30 milyondan fazla kişiye ve 50.000 ekibe güvenilir öneriler sunmamıza yardımcı olan olgun bir dilbilim ekosistemi ve makine öğrenimi araçlarına on yılı aşkın bir süredir yatırım yapıyoruz. Sorunuzu yanıtlamak için, Grammarly doğal dil işleme ekiplerinin nasıl çalıştığına dair kısa bir açıklama ile başlayacağım: Modelleri eğitmek için, Uygulamalı Araştırma Bilim Adamlarımız ve Makine Öğrenimi mühendislerimiz, dilbilimciler ve veri yorumlayıcılarla birlikte çalışır. Modelleri eğitmek için kullanılan verilerin yüksek kalitesini sağlamak için dilbilimciler ve ek açıklamalarla işbirliği yapmak çok önemlidir. Bir makine öğrenimi modeli, yalnızca onu eğitmek ve değerlendirmek için kullanılan veriler kadar iyidir. Yüksek kaliteli bir etiketli veri seti oluşturmak için iyi bir açıklama süreci şarttır. Burada insanlar, makine öğrenimi uzmanlarının modellemeye çalıştıkları şey hakkında bilgi sağlayan veri girişlerini işaretler veya sözde “altın verilere” dönüştürür. Örneğin, dilbilgisi hatalarını düzeltebilecek bir model geliştirmek için kullanılan böyle bir “altın veri kümesi” oluşturmak için, açıklama yapanlardan çeşitli örnek cümleler için bu hataları tam olarak tanımlamaları istenir.

Modellerimizi eğitmek için çeşitli veri noktaları kullanıyoruz. Örneğin, genel modelleri eğitmek için genellikle halka açık veri kümeleriyle başlarız. Kullanıcılarımızdan, her zaman numune bazında toplanan anonimleştirilmiş ve kişiselleştirilmemiş bilgileri de kullanabiliriz. Bu, son kullanıcılarımızı göz önünde bulundurarak belirli kullanım durumlarına yönelik bir ürün geliştirmek ve ayrıca neden belirli öneriler sunduğumuzu görmelerini sağlamak için önemlidir. Şu şekilde çalışır: Grammarly metni işledikten sonra içeriğin hesapla ilişkisi kesilir ve silinir. Algoritmalarımızı eğitmek için bazı rastgele metin parçacıkları saklayabiliriz. Ancak bunu yaptığımızda, bir kullanıcıya kadar izlenemeyecekleri şekilde ilişkileri kesilir ve kimlikleri kaldırılır.

Dilbilgisi ve yazım hatalarına ek olarak, Grammarly ayrıca yazılı metinlerin tonalitesini de tanır. Bunu nasıl yapıyorsun?

Tonalite, etkili iletişimin önemli bir parçasıdır. Niyet ettiğiniz şekilde anlaşılmak, sadece ne söylediğinize değil, nasıl söylediğinize de bağlıdır. 2019’da, kullanıcıların doğru sesi bulmasına yardımcı olmak için “Ses Dedektörü” adlı bir özelliği kullanıma sunduk. Sinyalleri aramak ve analiz etmek için kuralların ve makine öğrenimi modellerinin bir kombinasyonunu kullanır. Buna kelime seçimi, noktalama işaretleri, büyük harf kullanımı, olumsuzlar ve “çok” veya “aşırı derecede” gibi pekiştirici sözcükler dahildir. Ses tonu, dili anlamanın önemli bir parçasıdır ve Grammarly’nin yardımının dilbilgisi ve hecelemenin ötesine geçtiğine iyi bir örnektir.

Son birkaç yılda bu yazma alanlarını keşfetmeye devam ettik ve bu sonbaharda üslubu yenilemek için yeni öneriler getirdik. İfadeyi yeniden ifade etme önerileri, daha bağlamsal olduklarından, daha fazla senaryoyu kapsadıklarından ve tüm cümleleri yeniden ifade etme yeteneğiyle daha geniş destek sağladıklarından Dilbilgisi geri bildiriminin kapsamına ve derinliğine katkıda bulunur. Örneğin, etkileşimleri yapıcı ve çözüm odaklı hale getirmeye yardımcı olabilirler. Veya kişisel veya profesyonel ilişkiler kurmak ve güçlendirmek için katı veya kişisel olmayan görünen cümleleri yeniden yazmaya yardımcı olurlar. Kullanıcılar her zaman tonun önerilen yeniden ifadesiyle önerileri görme ve kendi özel mesajları ve bağlamları için doğru tonu belirleme seçeneğine sahiptir. Bu nedenle, yazar her zaman nihai kararı tercihlerine göre verir.


Şimdiye kadar, dil düzeltmeniz yalnızca İngilizce olarak mevcuttur. Grammarly, aracın Almanca sürümünü Berlin merkezinde geliştirmeyi planlıyor mu?

İnsanların İngilizce’de etkili bir şekilde iletişim kurmasına yardımcı olmak için yapabileceğimiz daha çok şey var – bizim için mesele sadece gramer kontrolü değil (uzun zamandır böyle değil). Niteliksel olarak İngilizce açıklamalı verilerle karmaşık iletişim sorunlarını çözen yüksek kaliteli dil modelleri geliştiriyoruz. Bu çok büyük bir girişim ve gelecekte başka dilleri de düşünebiliriz, ancak şu anki odak noktamız İngilizce yazılı iletişimi desteklemek.


Berlin’de yeni açılan merkez, San Francisco, New York, Kiev ve Vancouver’daki köklü merkezlerimizin yanı sıra bir inovasyon merkezidir. Berlin’de mühendislik, ürün ve tasarım alanlarından, heyecan verici zorlukları birlikte çözmemize ve yeniliklerimizi ileriye taşımamıza yardımcı olacak yetenekleri bir araya getirmek istiyoruz. Büyüyen bir şirket olduğumuz için, her bir üyenin çok fazla “sahipliği” vardır, yani kişisel sorumlulukla birlikte ürün üzerinde etkisi vardır. Önümüzdeki birkaç yıl içinde Almanya’daki ekibimizi genişletmek için iddialı hedeflerimiz var ve yerel teknoloji topluluğunu daha iyi tanımak için sabırsızlanıyoruz.

Sayın Mertens, cevaplarınız için çok teşekkür ederim. Grammarly ile dil düzeltmenin etik soruları üzerine ikinci bir kısa röportaj önümüzdeki hafta yayınlanacak: Şiirle ve aynı zamanda hassas içerikle nasıl başa çıkıyorsunuz?

“Üç Soru ve Yanıt” serisinde iX, ister kullanıcının PC önündeki bakış açısı, ister yöneticinin bakış açısı veya bir yöneticinin günlük yaşamı olsun, günümüzün BT zorluklarının özüne inmek istiyor. Günlük uygulamanızdan veya kullanıcılarınızdan önerileriniz var mı? Hangi konuda kimin tavsiyelerini kısaca okumak istersiniz? O zaman lütfen bize yazın veya forumda bir yorum bırakın.



iX Magazine'den daha fazlası



iX Magazine'den daha fazlası




(jvo)



Haberin Sonu