Przedstawiamy Scribe v2
- Opublikowano
PosłuchajPosłuchaj tego artykułu
Scribe v2 jest stworzony do masowej transkrypcji, tworzenia napisów i podpisów. Poprawia stabilność i dokładność Scribe v1, lepiej radząc sobie z długimi nagraniami, pauzami, zmianami tonu i długimi przerwami.

Podczas gdy Scribe v2 Realtime jest zoptymalizowany pod kątem ultra niskiej latencji i zastosowań agentów, Scribe v2 jest zoptymalizowany do długich i złożonych nagrań, utrzymując dokładność wśród różnych mówców, akcentów i stylów wypowiedzi. Efektem są niezawodne transkrypcje w różnych rzeczywistych warunkach audio.
Scribe v2 osiąga najniższy wskaźnik błędów słów na standardowych benchmarkach branżowych.

Keyterm Prompting dla transkrypcji kontekstowej
Keyterm prompting wykracza poza standardowe Custom Vocabulary, wykorzystując kontekst transkrypcji. Wybierz do 100 słów lub fraz, a Scribe v2 dokładnie zdecyduje, kiedy je transkrybować. To idealne rozwiązanie dla dziedzin technicznych, nazw marek i języka branżowego.

Wbudowane wykrywanie jednostek z precyzyjnymi znacznikami czasu
Scribe v2 zawiera natywne wykrywanie jednostek do analizy strukturalnej audio.
Możesz wybrać do 56 kategorii w zakresie danych osobowych, danych zdrowotnych lub szczegółów płatności. Scribe v2 automatycznie wykryje te przypadki i ich dokładne znaczniki czasu w transkrypcji, ułatwiając przeglądanie, redagowanie lub przetwarzanie wrażliwych informacji na dużą skalę.
Dowiedz się więcej w dokumentacji API: https://elevenlabscreator.arsenaldigitalweb.com.br/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection
Automatyczna transkrypcja wielojęzyczna
Scribe v2 obsługuje inteligentne wielojęzyczne workflow od razu po uruchomieniu.
Możesz przesłać audio zawierające wiele języków w jednym pliku. Model automatycznie wykrywa każdy język i transkrybuje go poprawnie bez ręcznego segmentowania czy konfiguracji.
Dodatkowe funkcje dla workflow produkcyjnych
Scribe v2 zawiera zestaw funkcji zaprojektowanych dla przedsiębiorstw i deweloperów:
- Inteligentna diarizacja mówców dla jasnego, intuicyjnego oznaczania mówców
- Precyzyjne znaczniki czasu na poziomie słów dla dokładnego dopasowania napisów i interaktywnych doświadczeń
- Dynamiczne tagowanie audio wykrywające zdarzenia niebędące mową, takie jak śmiech czy kroki
- Gotowość dla przedsiębiorstw z zgodnością SOC 2, ISO 27001, PCI DSS L1, HIPAA i RODO, rezydencja danych w UE i Indiach oraz wsparcie trybu zerowej retencji
Scribe v2, teraz w ElevenLabs Studio
Scribe v2 jest teraz używany w ElevenLabs Studio dla dokładniejszych napisów, podpisów i transkrypcji, wspierając zespoły zarządzające dużymi bibliotekami audio i wideo w marketingu, mediach, badaniach, szkoleniach i zgodności.

Wypróbuj teraz: https://elevenlabscreator.arsenaldigitalweb.com.br/app/studio
Buduj z API
Dzięki Scribe v2 deweloperzy i przedsiębiorstwa mogą automatyzować złożone procesy audio, poprawiać dokładność w globalnych workflow treści i skalować bezpiecznie z pełną zgodnością i kontrolą rezydencji danych.

Scribe v2 jest dostępny już dziś przez nasze API i platformę Creative.
Wypróbuj teraz: https://elevenlabscreator.arsenaldigitalweb.com.br/app/speech-to-text
Przeczytaj dokumentację: https://elevenlabscreator.arsenaldigitalweb.com.br/docs/capabilities/speech-to-text
Zarejestruj się tutaj: https://elevenlabscreator.arsenaldigitalweb.com.br/speech-to-text




