Infos

Sie befinden sich in den Archiven der Kategorie Maschinelle Übersetzung.

Calendar
Februar 2012
M D M D F S S
« Jan    
 12345
6789101112
13141516171819
20212223242526
272829  

Archiv der Kategorie Maschinelle Übersetzung

US-Militär arbeitet an C3PO-Nachbau

Das US-Militär hat die Entwicklung eines Übersetzungsroboters begonnen. Dieser ähnelt dem Protokolldroiden C-3PO (Class 3, Protocol Droid) aus der Star-Wars-Saga sehr. Der sog. BOLT (Broad Operational Language Translation) soll nicht nur in der Lage sein, Sprachen zu übersetzen, sondern auch Handlungen verstehen bzw. deuten und 250 verschiedene Gegenstände erkennen können. Der Roboter soll zudem mit visuellen und taktilen Sensoren ausgestattet sein und somit sehen, fühlen und verstehen können. Der Kongress der Vereinigten Staaten unterstützt dieses Projekt des für die Forschung zuständigen Amtes des Verteidigungsministeriums mit 15 Millionen US-Dollar.

Schon jetzt setzen die USA vor allem in arabischsprachigen Ländern eine Übersetzungssoftware ein. Diese ist allerdings verbesserungsbedürftig, da sie bei Dialekten und komplexen Aussagen nicht weiterhilft. Mit BOLT sollen nicht nur zwischenmenschliche Übersetzungen (wobei der Schwerpunkt auf der Übersetzung zwischen englischer und arabischer Sprache, inklusive der Dialekte, liegt) ermöglicht werden, sondern auch solche zwischen Mensch und Maschine möglich sein, d.h. also der Roboter soll beispielsweise mit E-Mails oder Microsoft Excel umgehen können. Hierbei soll keine Rolle spielen, ob es sich um einen geschriebenen oder gesprochenen Text handelt – BOLT soll imstande sein, genreunabhängig zu arbeiten.

Über C-3PO
Der Charakter aus dem Star-Wars-Universum ist ein Android speziell für die Interaktion mit Lebensformen. Der Protokolldroid sorgt für einen reibungslosen Ablauf bei Treffen zwischen verschiedenen Kulturen. Nach eigenen Angaben beherrscht er über sechs Millionen Kommunikationsformen. Seine Stimme und seine Verhaltensweisen sind bemerkenswert menschenähnlich – dies soll eine Zusammenarbeit mit humanoiden Besitzern erleichtern. Im Gegensatz zu dem mutigen, 0,96 m großen R2-D2, einem Astromech-Droiden, der sich auf Rädern fortbewegt, wie ein Mechaniker Raumschiffe repariert, nur Pfeiftöne von sich gibt und dessen Sprache oft von seinem unzertrennlichen Freund C-3PO übersetzt wird, ist der 1,67 m große C-3PO ein Antiheld.

C-3PO redet viel und nervt seine Besitzer und Begleiter schnell mit seiner aufdringlichen Geschwätzigkeit, obwohl er stets äußerst höflich und vorsichtig handelt. Die Kooperation wird zudem dadurch erschwert, dass er sich über alles beschwert und zumeist R2-D2 daran schuld sein soll. Seine eingebaute Kreativität steigt von Stufe Null auf Stufe Drei. Aus diesem Grund übertreibt C-3PO häufig. Seinen Besitzer Luke hingegen stört dies nicht, weshalb er ihn nicht umprogrammiert. Luke ist nämlich der Ansicht, dass dies den Roboter noch menschlicher macht. C-3PO irrt sich oft und begeht Fehler, die er allerdings nicht einsehen will. Diese Eigenschaften und seine tollpatschige Art machen C-3PO noch menschlicher. Der Schöpfer von Star Wars George Lucas äußerte sich in Bezug auf C-3PO, R2-D2, Obi-Wan Kenobi und Anakin wie folgt: “Sie sind die eigentlichen Helden der Saga.” Gespielt wurde der C-3PO in den sechs Star-Wars-Filmen von Anthony Daniels (Bild unten).

[Text: Jessica Antosik. Quelle: krone.at, 06.04.2011; starwarss.de; starwars-union.de; jedipedia.de; wikipedia.de. Bilder: wikipedia.de; jedipedia.de.]

Europäisches Patentamt und Google beseitigen Sprachbarrieren für Europas Erfinder

Benoît Battistelli und Benoît Battistelli
Der Präsident des Europäischen Patentamts, Benoît Battistelli (links), und der belgische Google-Chef Antoine Aubert freuen sich über die Vereinbarung, von der beide Seiten profitieren

Das Europäische Patentamt (EPA) und Google haben am 24.03.2011 eine langfristige Kooperationsvereinbarung für die maschinelle Übersetzung von Patenten in verschiedene europäische, slawische und asiatische Sprachen unterzeichnet.

Im Rahmen dieser Partnerschaft wird das EPA Google Translate nutzen, um auf seiner Website Patentübersetzungen in 28 europäische Sprachen sowie in Chinesisch, Japanisch, Koreanisch und Russisch anzubieten. Im Gegenzug erhält Google Zugriff auf den kompletten EPA-Bestand an übersetzten Patenten und kann so seine Übersetzungstechnologie in Bezug auf den speziellen Sprachgebrauch in Patenten weiter verbessern. Bei der Vereinbarung, die nicht exklusiv ist, spielen finanzielle Aspekte keine Rolle.

Ab diesem Jahr können Unternehmen, Erfinder und Wissenschaftler sowie die interessierte Öffentlichkeit auf der EPA-Website - zu Informations- oder Recherchezwecken - in den EPA-Amtssprachen Deutsch, Englisch und Französisch nach Patenten suchen und sie dann direkt in eine andere Amtssprache übersetzen lassen. Das Angebot soll schrittweise um weitere europäische Sprachen sowie um Chinesisch, Japanisch, Koreanisch und Russisch ergänzt werden. Der Abschluss des Projekts ist für 2014 geplant.

Durch die Partnerschaft zwischen dem EPA und Google lassen sich Millionen von Patenten, die in Europa, China, Japan, Korea und Russland erteilt wurden, kostenlos in Echtzeit übersetzen. Europäische Erfinder erhalten damit die Möglichkeit, Patente, die für sie relevant sind, gleichzeitig in allen EPA-Sprachen zu durchsuchen, was ihnen einen erheblichen Zeit- und Kostenvorteil bei ihrer Forschungs- und Entwicklungsarbeit verschafft.

„Die maschinelle Übersetzung hilft, Sprachbarrieren zu überwinden und die in Patenten enthaltenen Informationen weltweit zugänglich und verfügbar zu machen. Das neue Übersetzungstool ist ein weiterer Schritt zur Stärkung der Innovation in Europa und erlaubt es den europäischen Unternehmen, mit ihren Wettbewerbern in anderen Regionen gleichzuziehen. Außerdem bin ich überzeugt, dass es eine Einigung beim Einheitspatent erleichtern wird“, so der EPA-Präsident Benoît Battistelli.

„Erfinder, Wissenschaftler und Innovatoren in ganz Europa werden von diesem Projekt stark profitieren, denn der Zeitaufwand für ihre Forschungs- und Entwicklungsarbeiten dürfte sich deutlich verkürzen, wenn sie den gesamten EPA-Bestand an europäischen, asiatischen und russischen Patenten in ihrer Muttersprache durchsuchen können“, sagt der Brüsseler Google-Chef Antoine Aubert. „Google Translate wurde entwickelt, um Sprachbarrieren abzubauen. Die Zusammenarbeit mit dem EPA wird genau dazu beitragen - für alle Europäer, egal welcher Muttersprache.“

Der große geografische Geltungsbereich der Vereinbarung unterstreicht die Rolle des EPA als führendem Anbieter der in Patenten enthaltenen technischen Information. Seit 1998 hat es sich das EPA zur Politik gemacht, die technischen Daten aus seinen Recherchensammlungen offen zu verbreiten. Darüber hinaus veröffentlicht es in Zusammenarbeit mit den Mitgliedstaaten auch nationale Patentsammlungen.

Seit 2004 ist das EPA auf dem Gebiet der maschinellen Übersetzung aktiv, um die wachsende Herausforderung zu bewältigen, die darin besteht, die Patentdaten in seinen Amtssprachen zugänglich zu machen. Die maschinelle Übersetzung ist außerdem zu einem wichtigen Instrument zur Verbreitung europäischer Patentdaten für die breite Öffentlichkeit und für spezialisierte Nutzer von Patentinformation geworden.

Europäisches Patentamt
Das Europäische Patentamt (EPA) hat den Auftrag, Innovation, Wettbewerbsfähigkeit und Wirtschaftswachstum zum Nutzen der Bürger Europas zu fördern. Seine Aufgabe besteht darin, auf der Grundlage eines zentralisierten Verfahrens für die Vertragsstaaten des Europäischen Patentübereinkommens (EPÜ), das am 5. Oktober 1973 in München unterzeichnet wurde und am 7. Oktober 1977 in Kraft trat, europäische Patente für Erfindungen zu erteilen.

Google Inc.
Googles innovative Suchtechnologie sorgt jeden Tag aufs Neue dafür, dass Millionen von Menschen auf der ganzen Welt die von ihnen benötigten Informationen finden. 1998 von den Stanford-Doktoranden Larry Page und Sergey Brin gegründet, ist Google mittlerweile auf allen wichtigen Märkten der Welt an erster Stelle im Web präsent. Das zielgerichtete Werbeprogramm von Google bietet Unternehmen aller Größenordnungen messbare Ergebnisse und verbessert gleichzeitig die allgemeine Web-Erfahrung für die Nutzer. Das Unternehmen mit Hauptsitz im Silicon Valley verfügt über ein Netz von Niederlassungen in ganz Amerika, Europa und Asien.

[Text: Rainer Osterwalder. Quelle: Pressemitteilung Europäisches Patentamt, 2011-03-24. Bild: Europäisches Patentamt.]

EU-Kommission muss 12 Mio. Euro Schadensersatz an Systran zahlen

Gericht der Europäischen Union

Das Gericht der Europäischen Union in Luxemburg (im Bild oben in der Zusammensetzung des Jahres 2009) hat die EU-Kommission dazu verurteilt, Schadensersatz in Höhe von 12.001.000 Euro an die Systran SA zu leisten. Die Kommission habe die Urheberrechte und das Know-how der Systran-Gruppe an der Unix-Version der Software für maschinelle Übersetzungen Systran von 1997 bis 2002 verletzt (Rechtssache T-19/07, Systran SA und Systran Luxembourg SA gegen die EU-Kommission). Nachfolgend die entsprechende Pressemitteilung:

Die außervertragliche Haftung der Union ist an das Zusammentreffen mehrerer Voraussetzungen geknüpft, und zwar an die Rechtswidrigkeit des einem Organ vorgeworfenen Verhaltens, das Vorliegen eines Schadens und das Bestehen eines ursächlichen Zusammenhangs zwischen dem behaupteten Verhalten und dem geltend gemachten Schaden.

Zwischen dem 22. Dezember 1997 und dem 15. März 2002 passte Systran Luxembourg ihre Software für maschinelle Übersetzungen Systran-Unix unter der Bezeichnung EC-Systran Unix an die spezifischen Bedürfnisse der Kommission an.

Am 4. Oktober 2003 veröffentlichte die Kommission eine Ausschreibung für die Wartung/Pflege und linguistische Verbesserung ihres maschinellen Übersetzungssystems. Die Leistungen, die die Kommission dem erfolgreichen Bieter übertragen hat, betrafen nach der Ausschreibung insbesondere die Verbesserungen, Anpassungen und Zusätze zu Sprachroutinen, die spezifischen Verbesserungen der Analyse-, Synthese- und Transfer-Programme sowie die Aktualisierungen des Dienstes.

Auf diese Ausschreibung hin wies Systran, das Mutterunternehmen von Systran Luxembourg, die Kommission darauf hin, dass die auszuführenden Arbeiten ihre Rechte des geistigen Eigentums verletzen könnten. Seit über vierzig Jahren bietet Systran nämlich auf der Grundlage der gleichnamigen Software Unternehmen und öffentlichen Einrichtungen Technologielösungen für maschinelle Übersetzungen an. Systran hat insbesondere eine Systran-Version entwickelt und vertrieben, die in der Lage ist, auf den Betriebssystemen Unix und Windows zu arbeiten (Systran Unix) und die veraltete ältere Version zu ersetzen, die auf dem Betriebssystem Mainframe arbeitete (Systran Mainframe).

Nach mehreren Unterredungen zwischen Systran und der Kommission kam diese zu dem Schluss, dass Systran keine beweiskräftigen Unterlagen zum Nachweis von Rechtsansprüchen, die dieses Unternehmen auf ihren maschinellen Übersetzungsdienst EC-Systran Unix erheben könnte, vorgelegt habe. Nach Ansicht der Kommission ist die Systran- Gruppe folglich nicht berechtigt, sich den Arbeiten zu widersetzen, die von dem Unternehmen durchgeführt werden, dem der Zuschlag erteilt worden war.
Da sie der Auffassung sind, dass die Kommission mit der Auftragsvergabe rechtswidrig ihr Know-how einem Dritten weitergegeben und im Zusammenhang mit der Durchführung von unerlaubten Weiterentwicklungen der Version EC-Systran Unix durch den erfolgreichen Bieter eine Urheberrechtsverletzung begangen habe, haben Systran und Systran Luxembourg beim Gericht eine Schadensersatzklage gegen die Kommission erhoben.

Nachdem die Verfahrensbeteiligten im Rahmen eines von dem Gericht nach der mündlichen Verhandlung eingeleiteten Schlichtungsverfahrens nicht zu einer einvernehmlichen Lösung im Wege eines Vergleichs gelangt sind, entscheidet das Gericht nunmehr über die Schadenersatzklage.

Das Gericht stellt zunächst fest, dass der Rechtsstreit außervertragliche Ansprüche betrifft. In den in der Vergangenheit mit der Kommission geschlossenen Verträge über die Nutzung der Software Systran sind nämlich die Fragen der Weitergabe des Know-how von Systran an Dritte oder die Durchführung von Arbeiten, die die Rechte des geistigen Eigentums der Systran-Gruppe beeinträchtigen könnten, nicht geregelt.

Was die Rechtswidrigkeit des der Kommission zur Last gelegten Verhaltens betrifft, ist das Gericht der Ansicht, dass die Systran-Gruppe eine wesentliche Ähnlichkeit zwischen den Versionen Systran Unix und EC-Systran Unix hinsichtlich des Kerns und gewisser Sprachroutinen (Sprachprogramme) nachgewiesen hat und dass sie folglich die Rechte an der Version Systran Unix, die Systran seit 1993 entwickelt und vertrieben hat, geltend machen kann, um sich der Weitergabe der abgeleiteten Version EC-Systran Unix, die seit 1997 von Systran Luxembourg an die Bedürfnisse der Kommission angepasst worden war, an Dritte ohne ihre Zustimmung zu widersetzen.
Die Kommission konnte hingegen nicht nachweisen, auf welche Elemente des Kerns und der Sprachroutinen von Systran Unix sie insbesondere aufgrund ihrer Rechte an den von ihren Dienststellen eingegebenen Wörterbüchern Eigentumsansprüche geltend macht.

Darüber hinaus hat Systran nachgewiesen, dass – entgegen dem Vorbringen der Kommission – für die in der Ausschreibung geforderten Änderungen der Zugriff auf die in der Version EC-Systran Unix übernommenen Elemente der Version Systran Unix und deren Änderung erforderlich ist.

Folglich hat die Kommission rechtswidrig gehandelt und die den Mitgliedstaaten gemeinsamen allgemeinen Rechtsgrundsätze auf dem Gebiet des Urheberrechts und des Know-how verletzt, indem sie sich ohne vorherige Zustimmung der Systran-Gruppe das Recht genommen hat, Arbeiten durchzuführen, die zu einer Änderung von in der Version EC-Systran Unix enthaltenen Elementen der Version Systran Unix der Software Systran führen mussten. Dieses Fehlverhalten, das eine hinreichend schwerwiegende Verletzung der Urheberrechte und des Know-how der Systran-Gruppe an der Version Systran Unix der Software Systran darstellt, löst die außervertragliche Haftung der Union aus.

In Bezug auf den Schaden entscheidet das Gericht, dass Systran Schadenersatz in Höhe von 12 001 000 Euro als Ersatz des ihr durch das rechtswidrige Verhalten der Kommission entstandenen Schadens zu gewähren ist, nämlich

  • 7 Millionen Euro für die Lizenzgebühren, die für die Jahre 2004 bis 2010 geschuldet worden wären, wenn die Kommission die Erlaubnis zur Nutzung der Rechte des geistigen Eigentums von Systran eingeholt hätte, um die in der Ausschreibung aufgelisteten Arbeiten durchzuführen, für die der Zugriff auf die in der Version EC-Systran Unix übernommenen Elemente der Version Systran Unix und deren Änderung erforderlich ist;
  • 5 Millionen Euro als Ersatz für die Auswirkungen, die das Verhalten der Kommission auf die von Systran in den Jahren 2004 bis 2010 erzielten Umsätze und im weiteren Sinne die Entwicklung dieses Unternehmens gehabt haben kann;
  • 1 000 Euro als Ersatz des immateriellen Schadens.

Außerdem weist das Gericht darauf hin, dass es der Kommission obliegt, die erforderlichen Schlussfolgerungen zu ziehen, um sicherzustellen, dass bei den Arbeiten an der Version EC-Systran Unix die Rechte von Systran an der Version Systran Unix berücksichtigt werden. Sollten diese Rechte nicht berücksichtigt werden, wäre Systran aufgrund des Umstands, dass der in der vorliegenden Rechtssache zugesprochene Schadenersatz nur den Zeitraum von 2004 bis zum Tag der Verkündung des vorliegenden Urteils betrifft, berechtigt, beim Gericht eine neuerliche Schadensersatzklage hinsichtlich des ihr möglicherweise noch entstehenden Schadens zu erheben.
Schließlich stellt das Gericht fest, dass die Verbreitung der vorliegenden Pressemitteilung auch zu einer faktischen Wiedergutmachung des immateriellen Schadens beiträgt, den die Rufschädigung von Systran durch das rechtswidrige Verhalten der Kommission darstellt.

HINWEIS: Gegen die Entscheidung des Gerichts kann innerhalb von zwei Monaten nach ihrer Zustellung ein auf Rechtsfragen beschränktes Rechtsmittel beim Gerichtshof eingelegt werden.
HINWEIS: Eine Nichtigkeitsklage dient dazu, unionsrechtswidrige Handlungen der Unionsorgane für nichtig erklären zu lassen. Sie kann unter bestimmten Voraussetzungen von Mitgliedstaaten, Organen der Union oder Einzelnen beim Gerichtshof oder beim Gericht erhoben werden. Ist die Klage begründet, wird die Handlung für nichtig erklärt. Das betreffende Organ hat eine durch die Nichtigerklärung der Handlung etwa entstehende Regelungslücke zu schließen.

EU-Gerichtshof

Der Gerichtshof der Europäischen Union, der seinen Sitz in Luxemburg hat, besteht aus drei Gerichten: dem Gerichtshof, dem Gericht (errichtet 1988) und dem Gericht für den öffentlichen Dienst (errichtet 2004). Ihre Aufgabe besteht darin, die Rechtmäßigkeit der Handlungen der Organe der Europäischen Union zu überprüfen, darüber zu wachen, dass die Mitgliedstaaten den Verpflichtungen nachkommen, die sich aus den Verträgen ergeben, und auf Ersuchen nationaler Gerichte das Unionsrecht auszulegen.

[Text: Gericht der Europäischen Union. Quelle: Pressemitteilung Nr. 123 des Gerichts der Europäischen Union, 2010-12-16. Bild: Pressestelle Gericht der Europäischen Union.]

Berliner Schaubühne: Babelfish, die Übersetzungsquizshow

Berliner Schaubühne

„Die beliebte Spielshow ist zurück“, vermeldet die Schaubühne in Berlin. Gemeint ist „Babelfish, die Übersetzungsquizshow“, bei der am 3. Juni 2010 auf der Bühne kurze Zitate aus Literatur, Politik, Sport und Film vorgestellt werden. Zitate, die maschinell zunächst ins Englische und wieder zurückübersetzt wurden.

Das passende Werkzeug dafür ist die von Yahoo auf Systran-Basis betriebene Webanwendung „Babel Fish“. Eine derartige Textveredelung lasse Klassiker „in völlig neuem Glanz erstrahlen“, so die Schaubühne.

Die Moderatoren Sebastian Schwarz und Georg Uecker (bekannt aus der Fernsehserie „Lindenstraße“) werden prominente Quizkandidaten bitten, das Originalzitat zu erraten, das dem durch den linguistischen Fleischwolf gedrehten Text zugrunde liegt. Eingeladen wurde unter anderem David Gieselmann, „Deutschlands bester Komödienautor“ (Die Welt).

Kostproben für die Kreativität der Übersetzungsmaschine:

  • Ich Sortierfach. Ein Berliner.
    (John F. Kennedy: „Ich bin ein Berliner.“)
  • Alle Normalität. Konstante Temperatur und Normalität. Ich glaube. Nach Atmung; Reduzierung der ganz Wald. So wartet. Diese Möglichkeit.
    (Auszug aus „Wanderers Nachtlied“ von Goethe: „Über allen Gipfeln / Ist Ruh, / In allen Wipfeln / Spürest du / Kaum einen Hauch / Die Vögelein schweigen im Walde. /Warte nur, balde / Ruhest du auch.“)

Donnerstag, 03.06.2010, 21.15 Uhr, Schaubühne am Lehniner Platz, Berlin, Eintritt: 5,00 Euro.

www.schaubuehne.de/de_DE/program/detail/7532596

[Text: Richard Schneider, nach einem Hinweis von Emilia Picquenot-Chataigné. Bild: Presseservice Schaubühne.]

Och und Google befördern maschinelle Übersetzung auf neue Stufe

Das Nachrichtenmagazin Der Spiegel beleuchtet in einem schwärmerisch-naiven Artikel den aktuellen Stand der maschinellen Übersetzung (MÜ). Besonderes Augenmerk wird dabei auf die Arbeit von Franz Josef Och gelegt, der bei Google mit den von ihm mitentwickelten statistischen MÜ-Verfahren Erfolge feiert. Neben Och kommt auch Alex Waibel zu Wort, ein anderer bekannter Name in der MÜ-Szene.

Den Artikel können Sie auf der Spiegel-Website lesen.

Mehr zum Thema auf uepo.de
2003: Statistische Übersetzung mit Paralleltexten: Franz Josef Och mischt die MÜ-Branche auf
2006: Google und Franz Josef Och gewinnen MÜ-Wettbewerb des NIST für Chinesisch und Arabisch
2005: Prof. Waibels Wundermaschine: interACT soll simultan dolmetschen können
2006: „Alex Waibel ist dabei, einen Menschheitstraum wahr zu machen“ – behauptet der Tagesspiegel

c’t testet Übersetzungssoftware: Nur zur Inhaltserfassung brauchbar

Die sinngemäße Inhaltswiedergabe gelingt schon kostenlosen Online-Übersetzern vergleichsweise ordentlich, schreibt das Computermagazin c’t in der aktuellen Ausgabe 9/2010. Veröffentlichungsreife Übersetzungen konnte jedoch keines der sechs getesteten Programme liefern.

Die Testergebnisse zeigen, dass Online-Dienste mittlerweile genug Sprachkenntnisse haben, um Anwender mit einfachen Ansprüchen ausreichend zu unterstützen. “Um eine Sprachschule in England in kurzen einfachen Sätzen anzuschreiben, reichen die Online-Übersetzer aus. Sie machen daraus eine ordentliche englische Anfrage. Bei anspruchsvollen Texten stoßen maschinelle Übersetzer jedoch an ihre Grenzen”, erklärt c’t-Redakteurin Dorothee Wiegand.

Von den Online-Diensten überzeugte Bing nur bei Texten mit IT-Vokabular. Google und Systran machen als Allrounder unter den Web-Übersetzern eine bessere Figur. An die Übersetzungsqualität lokal installierter Programme reichte jedoch auch Systran nicht heran. Die kommerziellen Programme für den heimischen Rechner bieten zudem mehr Unterstützung beim Verbessern der Rohübersetzung. Dort können Anwender bestimmte Textpassagen wie Webadressen oder originalsprachliche Zitate von der Bearbeitung ausnehmen. Außerdem bieten sie Fachwörterbücher und Satzarchive, die man mit optimierten Übersetzungen füttern kann.

Anhand von 25 Testdateien prüfte die Redaktion die sprachliche Qualität der Übersetzungen. In eigens konzipierten Vokabeltests kamen zudem einige fiese Schwierigkeiten vor: altehrwürdige Wörter wie Barbier oder Ebenbild, bedrohte Wörter wie Schutzmann und Spülstein sowie Slang und Jugendsprache. Das stellte für die Programme eine echte Herausforderung dar. So wurde aus “Christkind” schon einmal “Santa Claus” oder aus der Standard-Briefanrede “Sehr geehrte Damen und Herren!”: “very SIRS!”.

[Text: Erik von Hoerschelmann. Quelle: Pressemitteilung Heise Medien-Gruppe, 2010-04-09.]

Jibbigo: Dolmetschsoftware für das iPhone

JibbigoWissenschaftler aus Karlsruhe, Pittsburgh und Silicon Valley haben gemeinsam einen Sprach-zu-Sprach-Übersetzer für das iPhone entwickelt, welcher jetzt über Apple vertrieben wird. Die Anwendung soll gesprochenes Englisch ins Spanische und umgekehrt übersetzen können.

Jibbigo, so der Name der Übersetzungssoftware, läuft auf dem iPhone 3GS und hat ein Vokabular von etwa 40.000 Wörtern. Das Kommunikationssystem ist vor allem für humanitäre Einsätze aber auch für Touristen gedacht. Der Nutzer spricht ein oder zwei Sätze in sein Mobiltelefon und dieses gibt umgehend die Übersetzung per Sprache und Text aus.

“Jibbigo läuft direkt auf dem iPhone und benötigt keinen Zugang zum Internet oder einem Server”, sagt Alex Waibel (Bild unten), Professor für Informatik am Karlsruher Institut für Technologie (KIT) und an der Carnegie Mellon University, Pittsburgh, USA. “Diese Unabhängigkeit ist ein entscheidender Vorteil für Reisende oder Helfer bei humanitären Einsätzen fernab des Einzugsbereichs von Mobilfunkanlagen. Es sind gerade diese Gegenden, in denen es kaum drahtlose Hotspots gibt, wo Jibbigo am nötigsten gebraucht wird”, so Waibel. Für Touristen ein weiterer Vorteil: Es fallen keine teuren Roaming-Gebühren an.

Waibels Forschungsgebiet ist die automatische Sprach-zu-Sprach-Übersetzung. Bereits 1990 entwickelte er den ersten Sprach-zu-Sprach-Übersetzer für Englisch, Deutsch und Japanisch. Er ist Direktor des international center for Advanced Communication Technologies (interACT), einem internationalen Forschungsverbund aus vier führenden Universitäten in diesem Bereich.

“Jibbigo wurde in einer Firmenneugründung von Absolventen der interACT Partner an Standorten in drei Kontinenten in einem internationalen Team rasch entwickelt”, sagt Waibel. “Es zeigt, dass eingespielte internationale Teams zu erstaunlichen Leistungen fähig sind und wissenschaftliche Erkenntnisse aus der Forschung rasch und effektiv umsetzen können.”

Alex WaibelMehr als 6000 verschiedene Sprachen werden auf der Welt gesprochen. Jibbigo soll dazu beitragen, die Verständigung unter den Menschen ein Stück einfacher und besser zu machen. An weiteren Sprachenpaaren wird mit Hochdruck gearbeitet.

Weitere Informationen unter: www.jibbigo.com

Das Karlsruher Institut für Technologie (KIT) ist eine Körperschaft des öffentlichen Rechts und staatliche Einrichtung des Landes Baden-Württemberg. Es nimmt sowohl die Aufgaben einer Universität als auch die eines nationalen Forschungszentrums in der Helmholtz-Gemeinschaft wahr.

[Text: KIT. Quelle: Pressemitteilung, 2009-11-04. Bild: KIT.]

Maschinelle Übersetzung soll EU-weite Abfrage der Strafregister ermöglichen

Die Gerichte und Staatsanwaltschaften der EU-Mitgliedstaaten sollen künftig schneller aktuelle Informationen über alle strafrechtlichen Verurteilungen eines Beschuldigten aus ganz Europa einholen können. Zu diesem Zweck haben die EU-Justizminister den Aufbau eines Europäischen Strafregisterinformationssystems (ECRIS, European Criminal Records Information System) vereinbart. Ein entsprechender Rahmenbeschluss wurde bereits im Juni 2007 gefasst, jetzt (Oktober 2008) wurden die technischen Regeln über den elektronischen Austausch festgelegt.

Im Zentrum steht dabei die Einführung eines einheitlichen Austauschformats, das die maschinelle Übersetzung der Informationen ermöglichen soll. Dazu werden für alle Straftatbestände Codenummern eingeführt, die in allen Ländern identisch sein sollen. Anhand der eindeutigen Nummern sollen dann eindeutige automatisierte Übersetzungen möglich sein. Die Schwierigkeit besteht darin, die 27 höchst unterschiedlichen Strafgesetzgebungen, die miteinander verbunden werden sollen, in ein einheitliches Nummernsystem zu pressen.

Der Deutsche Richterbund (DRB) begrüßt die Initiative und erhofft sich davon eine Erleichterung des Informationsaustausches. Ausländische Verurteilungen seien den Richtern im Inland häufig unbekannt und könnten daher bislang bei einer Verurteilung nur selten berücksichtigt werden. In einer Stellungnahme heißt es:

Datenschutzrechtliche Bedenken bestehen angesichts der beabsichtigten Ausgestaltung des Informationssystems nicht. Geplant ist weder die Einführung eines zentralen Strafregisters für alle europäischen Mitgliedstaaten, noch die Möglichkeit des unmittelbaren Online-Zugriffs durch jeden einzelnen Mitgliedstaat, sondern lediglich die Schaffung der technischen und logistischen Voraussetzungen für die Erteilung elektronischer Auskünfte bei Vorliegen einer entsprechenden Anfrage.

Es stellt sich allerdings die Frage, ob durch das vorgesehene System tatsächlich die Qualität des Informationsaustauschs wie vorgesehen verbessert werden kann. Hiergegen spricht aus Sicht des DRB zum einen, dass auch eine Abfrage in ECRIS eine individuelle Anfrage an einen oder mehrere Mitgliedstaaten voraussetzt. Hierzu muss sich aber aus den Ermittlungen überhaupt ein Anhaltspunkt für Beziehungen des Beschuldigten in diesen Staat ergeben. Insoweit ergibt sich aus hiesiger Sicht keine Verbesserung gegenüber dem Status quo.

Es dürfte jedoch nur eine Frage der Zeit sein, bis die einzelstaatlichen Register zu einem europäischen Zentralregister zusammengeführt werden. Die Überführung der Daten in ein einheitliches Format ist dazu nur der erste Schritt, mit dem die Mitgliedstaaten jetzt ohnehin erst einmal ein paar Jahre beschäftigt sind.

[Text: Richard Schneider. Quelle: Verlag C. H. Beck, 2008-10-27; DRB, 2008-09. Bild: Richard Schneider.]

Video-Interview mit den MÜ-Gurus von Google

Google Research, das weltweit größte und finanzkräftigste Forschungsinstitut für maschinelle Übersetzung (MÜ), hat auf seiner Website ein halbstündiges Interview mit den im eigenen Hause für die Forschung Verantwortlichen veröffentlicht.

Gastgeber ist Alfred Spector, VP of Research and Special Initiatives. Er befragt Mike Cohen, Manager - Speech Technology, und den Deutschen Franz Josef Och (Bild), Research Scientist Lead - Machine Translation. Och hat mit seinen Forschungsarbeiten an deutschen und amerikanischen Universitäten maßgeblich zum Siegeszug der relativ neuen statistischen Verfahren beigetragen. Diese haben die alten, regelbasierten Verfahren in vielen Bereichen bereits abgelöst.

Der Link zum Video:
http://research.google.com/roundtable/HLT.html

Das Google Translation Center: kein Übersetzungsbüro, sondern eine Paralleltext-Sammelmaschine

Die Suchmaschine Google, nebenbei das größte Translation Memory der Welt, testet zurzeit in Erweiterung der eigenen Forschungsaktivitäten zur maschinellen Übersetzung (MÜ) ein neues Angebot. Unter dem Titel Google Translation Center wird Übersetzern eine Arbeitsumgebung mit diversen Tools angeboten. Auftraggeber können über die Plattform nach Übersetzern suchen.

Dabei geht es Google nicht darum, als Vermittler von Übersetzungsaufträgen Geld zu verdienen: „Your interaction with any third party participant(s) or user(s) within Google Translation Center, including payment and delivery of goods and services, and any other terms, conditions, warranties or representations associated with such dealings, are solely between you and such third party participant(s) or user(s) and Google is not involved in such dealings.“

Auch für die Qualität der auf der Plattform erstellten Übersetzungen legt Google nicht die Hand ins Feuer. In der FAQ-Datei heißt es: „Does Google provide guarantees on the quality of the services provided by Google Translation Center? No. Translations created in Google Translation Center are purely between the translation requester and the translators.“

Der Zweck der Übung besteht vielmehr darin, Paralleltexte - vor allem in weniger verbreiteten Sprachen - für die Optimierung der von Google vehement vorangetriebenen maschinellen Übersetzung zu gewinnen.

Für Berufsübersetzer kommt das Übersetzungsportal von Google schon aus Vertraulichkeits- und Geheimhaltungsgründen nicht in Frage. Es reicht jedoch, wenn Schüler und Hobbyübersetzer die Plattform nutzen. Die fabrizierten Übersetzungen sind Google schon dann von Nutzen, wenn sie besser sind als maschinelle Übersetzungen. Eine Vorgabe, die jeder Abiturient erfüllen kann.

Google stellt mit dem Translation Center eine zumindest für Laienübersetzer komfortable und verlockende Arbeitsumgebung zur Verfügung. Im Gegenzug müssen die Übersetzer Google den Ausgangs- und Zieltext überlassen - eine überaus wertvolle Ressource für den MÜ-Giganten.

Google favorisiert beim maschinellen Übersetzen das relativ neue, so genannte statistische Verfahren im Gegensatz zum älteren, regelbasierten Verfahren mit vorgegebenen Wörterbüchern und grammatischen Regeln. Statistische Verfahren sind auf möglichst umfangreiche Korpora von Paralleltexten angewiesen.

Bisher wurden dazu die umfangreichen Bestände der EU und der UNO sowie die von Google erfassten mehrsprachigen Websites herangezogen. Vor allem für exotische Sprachen ist die in fast 2.400 Sprachen vorliegende Bibel von unschätzbarem Wert.

Franz Josef OchEiner der zurzeit erfolgreichsten MÜ-Forscher und bei Google in leitender Funktion tätig ist der Deutsche Franz Josef Och (Bild). Schon in seiner Diplomarbeit 1998 an der Uni Erlangen-Nürnberg hat er sich mit statistischen Verfahren in der maschinellen Übersetzung beschäftigt. Weitere Karrierestationen waren die Promotion an der RWTH Aachen und einige Forschungsjahre an der University of Southern California - bis Google ihm schließlich ein Angebot machte, das er nicht ablehnen konnte. Google Research dürfte heute das finanziell und technisch am besten ausgestattete MÜ-Forschungsinstitut der Welt sein.

Och selbst schreibt im „Google Research Blog“ am 28.04.2006:

Because we want to provide everyone with access to all the world’s information, including information written in every language, one of the exciting projects at Google Research is machine translation. Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars.

Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model. We have achieved very good results in research evaluations.

Zurzeit befindet sich das Google Translation Center in der Beta-Phase und kann nur von Google-Mitarbeitern, deren Angehörigen und Freunden genutzt werden. Eigentlich sollte das ganze Projekt noch streng vertraulich behandelt werden. Dass in den letzten Tagen überhaupt Informationen darüber an die Öffentlichkeit gelangten, verdanken wir den aufmerksamen Autoren des Blogs “Google Blogoscoped“.

Links zum Thema im Übersetzerportal:
17.09.2003 - Statistische Übersetzung mit Paralleltexten: Franz Josef Och mischt die MÜ-Branche auf
15.11.2006 - Google und Franz Josef Och gewinnen MÜ-Wettbewerb des NIST für Chinesisch und Arabisch

|