Google fügt OCR-Unterstützung für 34 Sprachen hinzu

Google ist bereits seit geraumer Zeit im Geschäft mit OCR ( OCR = Optical Character Recognition) tätig und hat dieses Feature heute aktualisiert, um 29 neue Sprachen zu unterstützen. Im September 2009 erwarb Google reCAPTCHA, und seither kämpfen sie gleichzeitig gegen Spam und verbessern die Übersetzung durch die Wörter, die die Leute eingeben. Das Update, das wir heute sehen, ist das Ergebnis der Arbeit, die sie seit der Einführung des Technologie.

Was ist OCR?

Wenn Sie uns nur beitreten, ist die optische Zeichenerkennung ein automatisiertes System, das ein Bild von Text in codierten auswählbaren Text übersetzt. Google verwendet OCR, um Ihre Bilder und PDF-Dateien zu scannen. Anschließend wird der Scan in ein bearbeitbares Google Doc-Format umgewandelt. In den letzten zwei Jahren hat Google menschliche Eingaben von reCAPTCHA-Puzzles verwendet, um den Erfolg bei der Erkennung komplexer Wörter zu steigern.

Welche Sprachen wurden hinzugefügt?

Neben den zusätzlichen Sprachen verbesserte Google auch die OCR-Qualität für die fünf zuvor implementierten Sprachen: Englisch, Italienisch, Deutsch, Spanisch und Französisch. Die 29 neuen Sprachen, die hinzugefügt wurden, sind die folgenden:

1. Bulgarisch
2. Katalanisch
3. Chinesisch (vereinfachtes Han)
4. Kroatisch
5. Tschechisch
6. Dänisch
7. Niederländisch
8. Filipino
9. Finnisch
10. Griechisch
11. Ungarisch
12. Indonesisch
13. Japanisch
14. Koreanisch
15. Lettisch

    16. Litauisch
    17. Norwegisch
    18. Polnisch
    19. Portugiesisch
    20. Rumänisch
    21. Russisch
    22. Serbisch
    23. Slowakisch
    24. Slowenisch
    25. Schwedisch
    26. Thai
    27. Türkisch
    28. Ukrainisch
    29. Vietnamesisch

    Stellen Sie beim Hochladen von Bildern oder PDF-Dateien in Google Text & Tabellen sicher, dass Sie die Sprache auswählen, in der der Text in Ihrer Datei verfasst ist. Legen Sie dazu Ihre Datei in die Warteschlange zum Hochladen und aktivieren Sie das Kontrollkästchen für Text aus PDF- oder Bilddateien in Dokumente von Google Text & Tabellen konvertieren . Ein Dropdown-Menü für die Dokumentsprache wird angezeigt. Dort können Sie Ihre Sprache auswählen .

    Haben Sie die OCR-Technologie von Google ausprobiert, um alte Familienzeitschriften, Bücher oder was auch immer Sie im Haus herumliegen zu scannen? Sie können es auch auf Ihrem iPhone oder Android-Smartphone ausprobieren, wenn Sie die Google Goggles App verwenden!