Reklam Alanı
Brandizma

Ara

    Newsletter image

    Bültenimize abone ol!

    Pazarlama dünyasındaki gelişmelerden ilk sen haberdar ol!

    Aydınlatma

    Web sitemizde en iyi deneyimi yaşamanızı sağlamak için çerezleri kullanıyoruz. Sitemizi kullanmaya devam ederek çerez kullanımımızı, Gizlilik Politikamızı ve KVKK bilgilendirmesini okumuş ve kabul etmiş olursunuz.

    ElevenLabs, Scribe ile Konuşmadan Metne Teknolojisinde Yeni Bir Dönem Başlatıyor

    379 görüntüleme

    ElevenLabs, yeni konuşmadan metne modeli Scribe'ı tanıttı. Bu model, özellikle yazarların kendi sesli kitaplarını oluşturup yayınlamalarını sağlayan platformuyla tanınan ElevenLabs’ın ilk bağımsız konuşmadan metne çözümü olarak karşımıza çıkıyor. Scribe, FLEURS ve Common Voice benchmark testlerinde, Google Gemini 2.0 Flash ve Whisper Large V3 gibi güçlü rakipleri geride bırakarak dikkatleri üzerine topladı.

    Scribe, şu anda 99’dan fazla dili destekliyor ve kelime hata oranı %5’in altında. Şirketin açıkladığına göre, 25’ten fazla dil mükemmel doğruluk kategorisinde yer alıyor. Bu diller arasında İngilizce, Fransızca, Almanca, Hintçe, Japonca, Portekizce, İspanyolca gibi yaygın dillerin yanı sıra, Kannada, Malayalam ve Vietnamca gibi daha az yaygın diller de bulunuyor. İngilizce gibi dillerde doğruluk oranı %97’yi buluyor.

    Modelin sunduğu özellikler arasında akıllı hoparlör günlüğü, kelime düzeyinde zaman damgası ekleyerek doğru altyazı üretimi ve izleyicilerin gülmesini veya diğer ses olaylarını otomatik olarak etiketleme gibi işlevler bulunuyor. Bu sayede, video içeriklerinin yazıya dökülmesi ve altyazı eklenmesi oldukça kolaylaşıyor. Ancak, şu anda yalnızca önceden kaydedilmiş ses formatlarıyla çalışabilen model, gerçek zamanlı bir versiyonunun yakında piyasaya sürülmesiyle daha geniş bir kullanım alanına sahip olacak. Bu durumda, Scribe henüz toplantı deşifreleri veya sesli not alma gibi gerçek zamanlı ihtiyaçlar için ideal bir çözüm sunmuyor.

    Fiyatlandırma açısından, Scribe saatte 0,40 dolar karşılığında sesin yazıya dökülmesini sağlıyor. Bu, rekabetçi bir fiyat olsa da bazı rakiplerin sunduğu özelliklerle karşılaştırıldığında biraz daha yüksek bir fiyat politikası izliyor.

    ElevenLabs CEO’su Mati Staniszewski, geçtiğimiz ay yaptığı bir açıklamada, konuşma algılama modelleri geliştirmeyi hedeflediklerini ve iç ekiplerin hızlı geri bildirim sağlayarak bu alanda önemli ilerlemeler kaydedeceklerini belirtmişti. Bu açıklamalar, şirketin gelecekteki projelerine yönelik büyük bir merak uyandırıyor.

     

    Yorumlar

    Henüz yorum yapılmamış.

    Yorum yapmak için giriş yapmanız gerekiyor.

    Son içerikler: