IT: Hilfsmittel
Aus Ecdlwiki
Inhaltsverzeichnis |
Hilfsmittel
Hilfsmittel ermöglichen Menschen mit einer Sehbehinderung den Zugang zu modernen Computermedien. Sie sind Zusatzgeräte oder Zusatzsoftware zur normalen Ausstattung eines Computers und versuchen die körperliche Einschränkung eines Menschen auszugleichen.
Brailledrucker
Brailledrucker dienen der Ausgabe von Text in Blindenschrift auf Papier und somit der im Endprodukt nicht stromabhängigen Vervielfältigung von Text. Ihr Aufbau ähnelt stark den in der Zwischenzeit weitgehend aus der Computerwelt verdrängten Matrixdruckern für Schwarzschrift. Im Gegensatz zu diesen benötigen sie aber kein Farbband, da die Brailleschrift ausschließlich durch Erhebungen im Papier entsteht. Das im Unterschied zu dem dünnen 80g/m^2 Papier für den Schwarzschriftdruck recht dicke Papier für den Punktschriftdruck wird je nach Druckermodell entweder direkt Bogen für Bogen eingezogen oder in Form von Endlospapier immer nachgezogen. "Punktschriftdrucker arbeiten überwiegend mit 12-Zoll Endlospapier. Die Punktschriftseite kann bis zu 30 Zeilen Braille aufnehmen. Die unterschiedlichen Papierformate ermöglichen eine Zeilenlänge von 30 bis etwa 44 Zeichen. Einige Drucker können sog. Zwischenpunktdruck ausgeben. Hierbei wird das Papier beidseitig bedruckt und nimmt somit die doppelte Textmenge auf." (Webdesign und Usability, http://www.ah-usability.de/index.htm?/formen/modifizierte_pc.) Beim Endlospapier müssen zusätzlich nach dem Druck mit Hilfe der seitlichen Perforierung die Seitenränder mit den Einzugslöchern abgetrennt werden. Die eigentliche Druckeinheit besteht aus einem kleinen Schiffchen, welches sich horizontal über das Papier bewegt und mit Hilfe kleiner Nadeln die Braillepunkte in das Papier stanzt. Das Papier wird nach jeder Zeile durch den Papiereinzug weiterbewegt. Einfachere Brailledrucker können jeweils nur eine Seite des Papiers bedrucken, teurere Modelle bieten eine automatische Duplexfunktion und erlauben damit den oben genannten Zwischenpunktdruck. Da Brailledrucker prinzipbedingt durch das Stanzen der Erhebungen in das Papier sehr viel Lärm produzieren, werden für sie auch Schalldämmgehäuse verkauft, welche den Lärm zumindest in einem ertragbaren Rahmen halten. Manche elektronischen Brailleschreibmaschinen lassen sich übrigens auch als Brailledrucker benutzen. Diese sind zwar langsamer und bieten oft nicht so viel Komfort, eignen sich aber durchaus für kleinere Druckaufgaben.
Nicht ganz unproblematisch ist nach wie vor die Ansteuerung eines Brailledruckers vom PC. Im Gegensatz zu den heute üblichen grafikfähigen Schwarzschriftdruckern, die mittlerweile mit einem Punkteraster zwischen 300 und 2400 dpi drucken und für welche ausgereifte Druckertreiber für die meisten Betriebssysteme zur Verfügung stehen, werden immer noch viele Brailledrucker als nichtgrafikfähige Textdrucker angesprochen. Zu Zeiten von textorientierten Betriebssystemen wie MS-DOS, festen Schriftweiten und einer geringen Anzahl von Schriftarten war das nicht weiter problematisch, da zu dieser Zeit auch die meisten Schwarzschriftdrucker nicht grafikfähig waren und Programme von Haus aus darauf Rücksicht nahmen. Da heutige Programme aber fast ohne Ausnahme auf grafikorientierten Oberflächen arbeiten, eine Vielzahl an grafischen Gestaltungsmöglichkeiten bieten und sie auf dem Bildschirm bereits eine Voransicht des gedruckten Endprodukts bieten sollen, entstehen hier natürlich Probleme im Zusammenspiel mit Brailledruckern. Selbst wenn Programme in der Lage sind, mit Hilfe eines einfachen "Nur-Text" Druckertreibers zu drucken, so wird es spätestens dann problematisch, wenn der zu druckende Text verschiedene Formatierungen wie zum Beispiel Fettdruck, Absatzeinrückungen oder Unterstreichungen, Kopf- und Fußzeilen oder Seitennummerierungen enthält.
Wird ein solcher Text ohne weitere Überarbeitung auf einem Brailledrucker ausgegeben, so hat das Resultat meist nur noch wenig mit dem ursprünglichen Text gemeinsam und wird sehr unübersichtlich. Noch komplizierter wird es, wenn eine Ausgabe in 6-Punkt-Braille oder gar einer der vielen Kurzschriftvarianten gewünscht ist. Um dennoch ein ansprechendes Druckergebnis zu erhalten, gibt es verschiedene Möglichkeiten. Die einfachste, wenn auch leistungsschwächste Möglichkeit ist es, mit speziell auf den Drucker angepassten Vorlagendateien der Textverarbeitung zu arbeiten. Diese kann man sich mit wenig Aufwand und etwas Experimentierfreude selbst erstellen. Die Vorgehensweise ist simpel: Man installiert den Brailledrucker als "Nur-Text"-Drucker im System und legt ihn als Standardrucker fest. Dann bearbeitet man die Standardtextvorlage der Textverarbeitung. Man muss sie so abändern, dass in jeder Zeile nur so viele Zeichen stehen können, wie der Brailledrucker auch in einer Zeile darstellen kann und auf jeder Seite nur soviele Zeilen stehen können, wie es der Brailledrucker unterstützt. Ersteres erreicht man durch die Wahl einer Schriftart mit fester Schrittweite und einer Erhöhung der Schriftgröße. Durch die Anpassung der Seitenränder kann man leicht die Anzahl der möglichen Zeilen pro Seite beschränken oder erhöhen. Eine so erstellte Vorlagendatei reicht in der Regel schon aus, um einen mit ihr am Bildschirm erstellten Text in Braille zu Papier zu bringen.
Ungeeignet ist eine solche Lösung, möchte man von Fremden erstellte Texte auf dem Drucker ausgeben. Hierzu muss der Text nämlich zunächst in das Format der Vorlage umgewandelt werden. Sicher ist es möglich, dies durch Kopieren und Einfügen zu erledigen, solange man jegliche Formatierungen nicht mitkopiert, aber etwas Nachbearbeitung ist meist dennoch nötig. Besser ist es, wenn ein Makro diese Arbeit verrichtet und nebenbei auch einige Formatierungen in die Brailleausgabe rettet.
In der Theorie funktioniert eine solche Lösung wie folgt: Ein beliebiges Textdokument wird in der Textverarbeitung geöffnet und anschließend das Umwandlungsmakro aufgerufen. Dies kann auf unterschiedlichen Wegen geschehen, entweder durch eine Tastenkombination oder durch einen Menüeintrag. Das Makro erzeugt ein neues, leeres Dokument und kopiert den Text aus dem Quelldokument über die Zwischenablage hinein. Im nächsten Arbeitsschritt werden alle Formatierungen und Elemente (z.B. Bilder) gelöscht, welche ein Brailledrucker nicht wiedergeben kann. Manche Formatierungen werden auch einfach verändert. So werden zum Beispiel als Überschrift markierte Absätze unterstrichen oder in Großbuchstaben umgewandelt. Auch überflüssige Leerzeilen oder Leerzeichen werden beseitigt, um Platz auf dem Papier für die Inhalte zu schaffen. Manche Makros bieten sogar eine Ausgabe in 6-Punkt-Braille an, indem sie alle Buchstaben in Kleinbuchstaben verwandeln und Großzeichen bzw. Zahlzeichen einfügen. Im nächsten Schritt werden dann Schriftart und Schriftgröße sowie die Seitenränder angepasst, nach Bedarf auch Seitenzahlen eingefügt und der Auftrag an den Drucker geschickt. Auch das Umwandeln in Kurzschrift ließe sich durch ein Makro bewerkstelligen, auf Grund des komplexen Regelwerks aber wird dies meist Spezialprogrammen überlassen.
Die für den Anwender komfortabelste Lösung stellt indes ein echter Druckertreiber dar, der die eben beschriebenen Umwandlungsschritte anwendungsunabhängig durchführt. Für moderne Brialledrucker existieren solche Lösungen auch, welche, wenn es denn der Drucker unterstützt, auch den Duplexdruck, also das gleichzeitig beidseitige Bedrucken von Blattvorder- und Rückseite, ermöglichen. Diese Druckertreiber verhalten sich gegenüber einer Anwendung wie normale Drucker und sind daher universeller einsetzbar.
Neben Brailledruckern, welche nur die Textausgabe beherrschen, gibt es auch Exemplare zu kaufen, die als grafikfähig gelten. Diese haben gegenüber reinen Textdruckern den Vorteil, dass sie ihre Punkte, wenn auch im Vergleich zu Schwarzschriftdruckern in sehr grobem Raster, beliebig auf dem Papier verteilen können und so auch einfache, tastbare Diagramme oder Zeichnungen möglich werden. Die nötigen Zeichenprogramme dafür kann man über die Druckerhersteller beziehen.
Die Druckermodelle der Serie Tiger von der Firma ViewPlus Technologies unterscheiden sich von herkömmlichen Brailledruckern. Sie ähneln in ihrem Aufbau den Matrixdruckern noch stärker. Ihre Druckköpfe setzen sich aus vielen kleinen Nadeln zusammen, die erst im Zusammenspiel einen Braillepunkt in das Papier stanzen können. Die Nadeln der Tiger-Drucker Serie können mit unterschiedlicher Kraft in das Papier gedrückt werden und erzeugen dadurch Erhebungen unterschiedlicher Höhe. Durch den kleineren Nadeldurchmesser und die variable Stanztiefe lassen sich mit einem Tiger-Drucker einfache taktile Grafiken mit höherer Auflösung als bei herkömmlichen Brailledruckern erzeugen.
Braillezeile
Die Braillezeile, auch Punktschriftzeile genannt, ist der Monitorersatz für einen blinden oder hochgradig sehbehinderten Menschen und damit sein wichtigstes PC-Ausgabegerät. Sie ermöglicht die Darstellung beliebiger Computertexte in Braille-Schrift. Das Gehäuse einer Braillezeile ist meist flach und wird so unter unter die Tastatur gestellt, dass die Anzeigen gut für die Finger erreichbar zum Benutzer hin hervorragen. Weiterhin gibt es auch Ausführungen, bei denen die Tastatur fester Bestandteil der Braillezeile ist oder bei denen die Braillezeile vor die Tastatur gestellt wird. Der Anschluss an den Computer erfolgt heute über den USB-Anschluss oder drahtlos über Bluetooth.
Eine Braillezeile setzt sich je nach Hersteller und Anwendungsgebiet aus acht bis 120 Braille-Elementen zusammen. Als Braille-Elemente bezeichnet man kleine Einzelbausteine, die alle den gleichen Grundaufbau haben: An der glatten Oberseite jedes Braille-Elements sind in zwei parallelen Reihen nebeneinander jeweils vier Löcher gebohrt, durch welche kleine Plastikstifte vertikal bewegt werden können. Die Durchmesser der Stifte entsprechen der Größe eines Punktschriftpunktes und die Abstände der Löcher zueinander enstsprechen den Abständen der Punkte innerhalb eines Braillezeichens. Bewegt werden die Braille-Stifte durch kleine Piezokristalle. Diese haben die Eigenschaft, sich beim Anlegen einer elektrischen Spannung zu verformen, man nennt dies auch den piezoelektrischen Effekt. Durch diese Verformung werden die Stifte ein Stück weit aus den Löchern herausgeschoben, so dass sie sich auf der Oberfläche des Braille-Elements als Punkte tasten lassen. Eine Steuerungselekronik im Inneren der Brailleelemente ermöglicht es, jeden einzelnen Stift gesondert anzusteuern und zu bewegen. Die 2 x 4 Matrix jedes Brailleelements ermöglicht es also, durch Anheben oder Absenken der Stifte jedes beliebige 8-Punkt- oder auch 6-Punkt-Braillezeichen darzustellen.
Auch wenn die klassische Brailleschrift aus nur sechs Punkten besteht, so eignet sich für die Arbeit am Computer die 8-Punkt-Brailleschrift besser, da sie mit ihren 256 möglichen Zeichen den gesamten ASCII-Zeichensatz ohne zusätzliche Ankündigungszeichen darstellen kann, wie sie die 6-Punktbrailleschrift zum Beispiel zur Unterscheidung der Zahlen von den Buchstaben benötigt.
Wie bereits erwähnt, werden bei einer Braillezeile mehrere dieser Brailleelemente nebeneinander angeordnet, um eine Zeile Text darzustellen, die der blinde oder hochgradig sehbehinderte Nutzer taktil lesen kann. Um eine Zeile Text des Computerbildschirms vollständig auf der Braillezeile darstellen zu können, werden abhängig vom verwendeten Schriftyp, der verwendeten Schriftgröße und der eingestellten Bildschirmauflösung unterschiedlich viele Einzelelemente benötigt. Bei Standardeinstellungen sind dies so um die 80. Für feste Arbeitsplätze werden daher häufig sogenannte 80er Braillezeilen gebaut (eben bestehend aus 80 Brailleelementen) Selbstverständlich gibt es aber auch Sonderanfertigungen mit mehr Zeichen, um Spezialanwendungsbegiete abzudecken.
Mobile Geräte für den Einsatz an Notebooks müssen schon alleine wegen der Gerätegröße mit 40 oder weniger Elementen auskommen, manche Notiz- oder Lesegeräte sogar mit nur acht Zeichen.
Zusätzlich zu denjenigen Brailleelmenten, die für die Wiedergabe des Textes zuständig sind, werden bei manchen Geräten noch weitere im Gehäuse untergebracht, die als Statusanzeigen dienen. Auf ihnen werden Beispielsweise Textattribute oder Zeilennummern dargestellt. Die Statusanzeigen befinden sich bei den unterschiedlichen Ausführungen entweder vor den textanzeigenden Brailleelementen oder auch, um 90° gedreht, am linken oder rechten Rand an der Oberseite.
Bisher wurden nur die Ausgabemöglichkeiten einer Braillezeile erläutert. Viele der heute erhältlichen Geräte enthalten aber darüber hinaus Möglichkeiten, Eingaben zu vorzunehmen. An erster Stelle zu erwähnen sind hierbei die sogenannten TAC-Tasten. TAC ist das Akronym für Tactile Activated Cursor und bietet - wie der Name schon andeutet - eine Möglichkeit, die Cursorposition im Text und auf dem Bildschirm zu verändern. Die TAC-Tasten sind entweder unmittelbar über den Braille-Elementen angebracht oder gleich in diese integriert.
Größere Tasten entweder an der Gehäuseoberseite oder an der Gehäusefront ermöglichen es dem Nutzer, Funktionen wie einen Zeilenwechsel anzuwählen oder auf dem Bildschirm zu navigieren. Neben diesen gibt es aber auch Tasten oder Schalter, die screenreaderspezifsche Sonderfunktionen anwählen können.
Manche mobile Geräte bieten zudem auch die Möglichkeit, auf der Braillezeile selbst Texteingaben zu tätigen und integrieren dazu Tasten zur Eingabe von 8-Punkt-Braille im Gehäuse. Ein kleiner Textspeicher im Inneren des Geräts in Kombination mit einem Akku ermöglicht so einen mobilen Betrieb auch ohne angeschlossenen Computer. So lassen sich unterwegs Notizen erstellen oder Texte lesen.
Sprachausgabe
Eine Sprachausgabe ist ähnlich der Braillezeile ein Computerausgabegerät. Mit ihrer Hilfe erhält der Nutzer akustische Rückmeldungen über Bildschirminhalte. Im alltäglichen Sprachgebrauch werden dabei häufig die Begriffe Sprachausgabe und IT: Screenreader gleichgesetzt bzw. synonym verwendet, was inhaltlich aber nicht korrekt ist. Die Funktion einer Sprachausgabe ist lediglich die Wiedergabe von Sprache. Dies geschieht entweder durch das Abspielen von Tonaufnahmen menschlicher Sprecher oder durch die Umwandlung von Text in akustisch wahrnehmbare Worte. Letzteres Verfahren wird in der Fachsprache auch als Text-To-Speech-System bezeichnet, abgekürzt durch TTS. Die Aufbereitung von Inhalten gehört indes nicht zu ihren Aufgaben.
Die Hauptvorteile der ersten Methode liegen in erster Linie in der hohen Sprachqualität und der, bei einer guten Sprecherwahl, hohen Verständlichkeit. Das Inventar möglicher Sätze ist aber fest, wiedergeben lässt sich nur, was vorher bereits aufgenommen wurde. Eine solche Sprachausgabe ist also gänzlich unflexibel. Zum Einsatz kommt sie in Anrufbeantwortern, z.B. zur Kartenvorbestellung in Kinos oder in Autonavigationssystemen. Im Hilfsmittelbereich werden sie zum Beispiel bei der Navigation in den Programmmenüs von Vorlesegeräten (nicht aber für die Vorlesefunktion selbst) eingesetzt. Flexibler sind die TTS-Systeme, bei denen man zwei Verfahren zur Spracherzeugung unterscheiden muss: Zum einen TTS-Systeme, die von einem Sprecher aufgenommene, Worte, Silben und Laute nach einem phonetischen Regelwerk zu Worten kombinieren, sogenannte Konkatenationssynthesen (engl. concatenation = Verkettung) und zweitens Sprachausgaben, die nach dem Verfahren der Formantsynthese Sprache völlig künstlich generieren.
Es ist leicht, sich vorzustellen, dass Sprachausgaben, die mit Konkatenationssynthese arbeiten, also ein Inventar an echter menschlicher Sprache besitzen, sehr aufwändig und damit teuer zu produzieren sind. Für jeden gewünschten Stimmentyp - männlich, weiblich, alt, jung etc. - muss ein Sprecher jedes Wort in verschiedenen Varianten aussprechen und dabei auf gleichbleibende Sprechgeschwindigkeit und konstante Tonhöhe achten. Zudem stellen Sprachausgaben nach diesem Modell, wenn sie ein großes Vokabular besitzen, sehr hohe Anforderungen an die Hardware, müssen doch in Bruchteilen von Sekunden aus tausenden von Sprachsamples die richtigen herausgefunden und miteinander kombiniert werden. Allein die Speicherung und der schnelle Zugriff auf eine solchen Menge von Daten beansprucht die Rechenkapazität eines Hochleistungscomputers. Auch bei den Konkatenationssynthesen muss man zwei Varianten unterscheiden. Die erste Variante speichert ganze Wörter in einer Datenbank und kombiniert diese zu Sätzen. Dabei kann sie aber nur diejenigen Wörter akustisch wiedergeben, für die sie auch Sprachsamples bereithält. Es liegt nahe, dass es in der Praxis annähernd unmöglich ist, das gesamte in einer Sprache potentiell vorkommende Vokabular in den verschiedenen möglichen Aussprachevariationen von einem Sprecher aufnehmen zu lassen. Da die Wörter nur zu neuen Sätzen kombiniert werden, ist zwar die Verständlichkeit gut, es fehlen aber der Satzrhythmus und die Satzmelodie.
Die zweite Variante verfolgt einen neueren Ansatz der Spracherzeugung mit dem Computer. Sie nutzt nicht die Aufnahme ganzer Wörter, sondern kombiniert geschickt von Sprechern aufgenommene Einzellaute unterschiedlicher Länge (rund 20000 veschiedene) oder Diphone. Dadurch wird die Sprachausgabe universeller, da nicht jedes Wort separat aufgenommen werden muss. Allerdings benötigt der Computer genaue Regeln, wann er welche Laute und Silben auf welche Art miteinander verbinden muss, um zur richtigen Aussprache zu gelangen. Da auch für diesen Ansatz menschliche Sprecher benötigt werden, ist auch er sehr kostspielig und wird bisher nur selten für Hilfsmittlel eingesetzt, zur Zeit vor allem in Vorlesesystemen. Die Sprachqualität dieser Ausgabe ist sehr hoch, da auch sie auf Aufnahmen menschlicher Sprecher zurückgreift, und zeichnet sich durch eine hohe Flexibilität aus. Ihre Verständlichkeit ist in jedem Fall besser als bei einer rein synthetischen Sprache.
Synthetische Sprachausgaben benötigen keine Stimmaufnahmen menschlicher Sprecher. Laute, Silben und Wörter werden nach mathematischen Regeln gebildet. Jeder Laut ist letzten Endes eine Schwingung und diese lässt sich durch eine mathematische Formel zumindest näherungsweise darstellen. Fügt man mehrere dieser Schwingungen hintereinander zusammen, erhält man Silben, aus denen sich wiederum Worte bilden lassen. Auch wenn dies stark vereinfacht ist, zeigt es doch das grundsätzliche Prinzip. Vorteilhaft an dieser Methode ist, dass sie nur moderate Anforderungen an die Hardware stellt und verhältnismäßig kostengünstig zu realisieren ist. Nachteilig ist der künstliche Klang und die schlechte Verständlichkeit der auf diese Weise erzeugten Sprache. Sie verlangt etwas Eingewöhnungszeit, obwohl sich ihre Sprachqualität in den letzten Jahren stark verbessert hat. Heute ist die rein synthetische Sprachgenerierung aufgrund ihrer großen Flexibilität und ihrer geringen Leistungsanforderungen die am häufigsten für Hilfsmittel genutzte Methode für Sprachausgabe.
Trotz vieler Fortschritte klingt computererzeugte Sprache im Vergleich zu menschlicher sehr künstlich und erfordert teilweise ein "Einhören", auch Aussprachefehler einzelner Wörter sind nicht selten.
Noch vor wenigen Jahren war die Sprachausgabe ein elektronisches Zusatzgerät mit einem externen Gehäuse und ähnlich wie die Braillezeile über ein Kabel mit dem PC verbunden. Bei diesen Geräten ließen sich meist nur Lautstärke und Sprechgeschwindigkeit über Drehregler anpassen, und die Sprache war für einen ungeübten Hörer fast nicht zu verstehen. Grund für die Auslagerung der Sprachausgaben in ein elektronisches Spezialteil war die geringe Rechenleistung der damals verfügbaren Rechner. Ein 386er PC mit 40 MHZ wäre schlichtweg von der Rechenleistung her mit der Aufgabe, Sprache zu erzeugen, überfordert gewesen. Die meisten PCs dieser Zeit besaßen nicht einmal ein Soundkarte. Mittlerweile sind diese Geräte vom Markt verschwunden. Heute sind Computer leistungsfähig genug, Sprache selbst mit Hilfe der mittlerweile zum Standard gehörenden Soundkarte zu erzeugen. Dies hat zudem den Vorteil, dass sich eine in die Jahre gekommene Sprachausgabe leicht durch eine neue, qualitativ bessere ersetzen lässt, ohne dass dazu eine gleichzeitige Erneuerung der Computerhardware notwendig wird. Nachteilig ist hingegen, dass sich die Sprachausgabe als Software die Computerressourcen wie Rechenleistung oder Audiokanäle mit anderen Programmen teilen muss. Ist der Rechner ausgelastet, kann es passieren, dass eine solche Sprachausgabe einmal mitten in der Wiedergabe abbricht oder langsamer wird. Schlecht programmierte Soundkartentreiber können gar zu einem "Stottereffekt" führen, welcher effektives Arbeiten am Rechner erschwert. Probleme können außerdem auftreten, wenn eine Soundkarte nicht ausreichend Audiokanäle unterstützt, denn in diesem Fall kommt es zu Konflikten mit anderen tonwiedergebenden Programmen.
Sprachausgabeprogramme bieten meist eine Reihe von Möglichkeiten, die Sprache dem persönlichen Geschmack anzupassen. So gibt es eine grundlegende Wahlmöglichkeit zwischen männlichen oder weiblichen Stimmen verschiedenen Alters und Schieberegler, mit denen sich die Sprechgeschwindigkeit regulieren lässt. Zu viel darf man aber von diesen Möglichkeiten nicht erwarten: Letzten Endes klingen sie alle sehr ähnlich, und ab einem gewissen Sprechtempo gehen die meisten Stimmcharakteristika ohnehin verloren. Einige Nachteile der Sprachausgabeprogramme seien noch erwähnt: Sie benötigen zunächst ein laufendes Betriebssystem, sind also erst einsatzbereit, wenn der Computer seinen Startvorgang weitgehend abgeschlossen hat. Man ist also im Einsatzgebiet eingeschränkter, hat zum Beispiel nicht die Möglichkeit, Biosmeldungen zu lesen um Hardwarefehler des Computers zu erkennen.
Im Vergleich zu einem menschlichen Sprecher klingt jede Sprachausgabe immer noch künstlich, es sei denn, sie arbeitet mit einem sehr kleinen und eingeschränkten Inventar an vollständigen Sätzen. Die Sprache ist emotionslos, bietet zu wenige Pausen, nutzt nicht den Reichtum an Intonationsmöglichkeiten - kurz gesagt, sie ist monoton. Die heute bereits gängige Umwandlung ist schon sehr komplex. Für jede Sprache muss die Sprachausgabe ein individuelles Ausspracheregelwerk beherrschen, zu dem dann jeweils noch eine Reihe von Ausnahmen hinzukommen. Viele Sprachausgaben führen daher kleine Wörterbücher, welche sich durch eigene Eintragungen benutzerspezifisch erweitern lassen. Da die Betonungen und die Satzmelodie von (Länder)Sprache zu Sprache verschieden sind, müssen auch diese Regeln der Sprachausgabe bekannt sein. Um ihre Wiedergabequalität zu verbessern orientieren sie sich zusätzlich an der Zeichensetzung. Regelhaft gibt es nach einem Punkt oder einem Komma eine kurze Sprechpause, während Fragezeichen zu einem Anheben der Stimmhöhe am Satzende führen.
Screenreader
Bevor Braillezeile oder Sprachausgabe auch nur ein Zeichen anzeigen bzw. einen Ton von sich geben, müssen sie wissen, was sie ausgeben sollen. Diese Information erhalten sie von einem sogenannten Screenreader, der sie wiederum aus dem Computer extrahiert. Ein Screenreader ist ein Computerprogramm, welches dauerhaft im Computers mitläuft, um Informationen für die Braillezeile oder die Sprachausgabe aufzubereiten. Die Qualität des Screenreaders entscheidet darüber, ob ein Programm für einen hochgradig sehgeschädigten Menschen nutzbar ist oder nicht. Eine grafische Oberfläche beinhaltet zu jedem Zeitpunkt eine Fülle an Informationen, wie zum Beispiel Fenster, Menüs, Textfelder und so weiter. Würden all diese Informationen, die ein computergeübter sehender Anwender in einem Augenblick erfassen kann, nacheinander über die Braillezeile oder die Sprachausgabe an den Nutzer weitergereicht, wäre dieser ob ihrer Fülle binnen kürzester Zeit überfordert, effektives Arbeiten wäre unmöglich. Ein Screenreader muss also aus der Vielzahl der Informationen diejenigen herausfiltern, welche für den Anwender in der gegebenen Situation gerade relevant sind. Bevor ein Screenreader aber anfangen kann, Informationen zu filtern, muss er zunächst in ihren Besitz kommen. Der Bildschirm besteht nicht nur aus Textzeilen, sondern wird aus einer großen Zahl von Bildpunkten, auch Pixel genannt, aufgebaut, die Text, Fenster, Knöpfe und andere Objekte darstellen. Typische im Heimbereich eingesetzte Bildschirmauflösungen von Computern sind Auflösungen im Bereich von 800 horizontalen und 600 vertikalen Bildpunkten (= 480000 Pixel) bis zu 1920 horizontalen und 1080 vertikalen Bildpunkten (= 2073600 Pixel). Text ist auf dieser Punktematrix frei positionierbar und wird in verschiedenen Größen und Formen als Grafik dargestellt. Ein Screenreader kann sich also nicht auf eine feste Zeileneinteilung verlassen, aus welcher sich Text leicht extrahieren lässt, sondern muss verschiedene Auflösungen und Darstellungsformen (Schriftarten und Formatierungen) von Schrift verarbeiten können.
Nicht der Bildschirm wird ausgelesen, sondern die Programme sollen die Informationen direkt an den Screenreader liefern. Optimal funktioniert das natürlich mit Unterstützung durch das Betriebssystem. Die Firma Microsoft entwickelte daher für ihr weit verbreitetes Betriebssystem Windows Schnittstellen zwischen Programmen und Screenreadersoftware. Mit Hilfe dieser Schnittstellen können Screenreader zahlreiche Informationen und vor allen Dingen Text von einem laufenden Programm abfragen. Solche Schnittstellen können aber nur funktionieren, wenn sie auch bei der Programmentwicklung berücksichtigt werden. Die meisten Firmen haben allerdings wenig Interesse daran, ihre Software für eine kleine Gruppe von Behinderten kostspielig anzupassen, und daher darf diese Anpassung nur einen geringen, am besten gar keinen Zusatzaufwand bedeuten. Die meisten Windowsprogramme halten sich an gewisse von Microsoft vorgegebene Standards, die den Programmaufbau, die Kommunikation mit dem Betriebssystem und die Bedienkonzepte regeln. Ein Benutzer von Windows soll sich darauf verlassen können, bestimmte Dinge immer an einem vorgegebenem Platz zu finden oder Routineaufgaben in allen Programmen auf gleiche oder zumindest ähnliche Art erledigen zu können. Zum Beispiel bietet fast jedes Programm eine Menüleiste und meist auch eine Knopfleiste zum Ansteuern häufig benutzter Funktionen. Niemand, der ein Programm für Microsoft Windows schreibt, will sich die Arbeit machen das Rad ständig neu zu erfinden und daher werden viele Teile eines Programms aus bereits vorgefertigten Komponenten, auch Objekte oder Controls genannt, zusammengesetzt, Beispiele für Controls sind Knöpfe (Buttons), Texteingabefelder usw.. Das ist etwa vergleichbar mit einem Legobaukasten: aus vielen kleinen Einzelteilen entsteht ein großes Gesamtbauwerk. Wenn ohnehin gewisse Standards gefordert werden, ist es sinvoll, sich dieser vorgefertigten Teile zu bedienen und nur neue Programmfunktionen selbst zu entwickeln. Da die Screenreader über die angebotenen Schnittstellen auf die Informationen in diesen vorgefertigten Objekten Zugriff haben, bekommen Programme, die aus ihnen aufgebaut sind, die Unterstützung für Screenreader quasi automatisch mit. Was aber in der Theorie gut klingt, funktioniert in der Praxis nicht immer. Nicht nur Microsoft bietet Programmentwicklungswerkzeuge an, sondern auch andere Firmen. Diese bringen ihre eigene Auswahl an Controls mit, welche häufig keine Schnittstellen zum Zugriff auf ihre Informationen bieten. Gerade Firmen, welche ihre Produkte gleichzeitig auch für andere Betriebssysteme entwickeln, scheuen häufig die teuren und ausschließlich auf Microsoft Windows ausgelegten Microsoft Entwicklungswerkzeuge.
Heutige Screenreader beschränken sich nicht darauf, ihre Informationen allein über vordefinierte Schnittstelle zu erhalten, sondern sie "belauschen" zusätzlich die ganze Kommunikation zwischen dem Betriebssystem und den Programmen um weitere Informationen zu sammeln und auszuwerten. Auch auf der Ebene der Grafikkarten versuchen Screenreader Informationen auszuwerten. So sind sie beispielsweise dazu in der Lage, Bilder wiederzuerkennen und ihnen eine Funktion zuzuordnen. Bei einem grafisch aufgebauten Programm, wie beispielsweise beim MP3 Player Winamp, "erkennt" der Screenreader den Abspielknopf anhand seiner grafischen Darstellung. Selbstverständlich muss die Grafik vorher durch den Menschen der Funktion zugeordnet worden sein. Auf diese Weise lassen sich auch solche Programme für sehgeschädigte Menschen zugänglich machen, die mit den herkömmlichen Mitteln unbedienbar wären.
Ging man in den Anfangszeiten der Screenreader anscheinend noch optimistisch davon aus, ein Universalwerkzeug schaffen zu können, welches nahezu jedes Programm für sehgeschädigte Menschen zugänglich machen würde, so hat man in der Zwischenzeit erkennen müssen, dass dies wohl eher ein Wunschtraum bleiben muss. Der derzeitige Stand sieht eher so aus, dass die weitgehend fehlerfreie Unterstützung durch den Screenreader, auch nur der am weitesten verbreiteten Programme aus dem Hause Microsoft, der eigentlichen Entwicklung einem halben bis zu einem ganzen Jahr hinterherhinkt. Dies hat zweierlei Gründe:
- Mit der Weiterentwicklung von Anwenderprogrammen und Betriebssystem verändern sich auch Bedienkonzepte und viele der Standardobjekte, aus denen die Programme aufgebaut sind. Auch wenn diese neuen Objekte Schnittstellen für die Screenreader anbieten, heißt das noch lange nicht, dass auch die Screenreader damit zurechtkommen. Häufig müssen die Schnittstelle um die Funktionen erweitert werden, die neu Einzug in das Betriebssystem gefunden haben. Diese Funktionen können ältere Versionen der Screenreadersoftware natürlich nicht nutzen. Schon ein kleines Programmupdate kann also dazu führen, dass eine Software unbedienbar wird, während die Version davor uneingeschränkt lauffähig war.
- Nachdem die Hersteller von Screenreadersoftware mit ihrem Universalansatz gescheitert sind, verfolgen sie heute eine andere Strategie: Programme werden über Zusatzskripte lauffähig gemacht. Solche Skripte zu erstellen, sie gegebenenfalls anzupassen und zu testen, kostet viel Zeit. Die Hersteller der Screenreader sind hierbei auf die Mitarbeit der Nutzer angewiesen, diese können Fehler melden oder in Newsforen Lösungsvorschläge einbringen. Für manche Screenreader gibt es sogar Anleitungen, wie man Skripte selbst programmieren kann. Dies ist sehr sinnvoll, denn die Hersteller erstellen ihre Skripte nur für die am weitesten verbreiteten Anwendungen, vornehmlich die der Firma Microsoft selbst.
Eine Aufgabe eines Screenreaders ist es, der Bildschirminhalte habhaft zu werden; eine zweite ist es, die so gewonnenen Information sinnvoll aufzubereiten. So muss er entscheiden, welche Informationen der Nutzer verlangt und welche vernachlässigt werden können, welche Informationen über die Sprachausgabe gehen sollen und welche an die Braillezeile weitergereicht werden. Ein guter Screenreader bietet daher verschiedene Ausführlichkeitsstufen, die sich individuell vom Benutzer anpassen lassen. So lässt sich beispielsweise einstellen, dass die Sprachausgabe jedes fertig getippte Wort wiederholt, während die Braillezeile den gesamten Text anzeigt, oder dass die Sprachausgabe Systemmeldungen mit einer anderen Stimme vorliest als selbst geschriebenen Text.
Eine weitere Herausforderung für alle Screenreader entstand durch den Siegeszug des World Wide Web. Die Benutzerschnittstellen der Webseiten folgen keiner Norm, es gibt keine offiziellen und verbindlichen Standards, welche die Seitengestaltung regeln. Den Text aus Webseiten herauszufiltern ist dabei keine schwierige Aufgabe, vielmehr aber diesen sinnvoll anzuordnen. Mehr dazu lesen Sie im Kapitel Internet: Arbeiten mit dem Webbrowser.
Bildschirmvergrößerung
Bildschirmvergrößerungssoftware bietet sehbehinderten Menschen die Möglichkeit, Bildschirminhalte in vergrößerter Darstellung zu betrachten. Wie durch eine Lupe, mit der man den Bildschirm betrachtet, erscheinen so Bedienelemente und vor allen Dingen Schrift in ausreichender Größe, um von einem sehbehinderten Menschen erkannt zu werden. Im einfachsten Fall wird hierzu jeder Bildpunkt durch drei weitere Bildpunkte gleicher Farbe ergänzt. Aus einem einfachen Quadrat eintsteht eines von vierfacher Größe. Würde man jeden Bildpunkt einfach nur verdoppeln, so entstünde ein verzerrtes Bild. Um eine solche Vergrößerungsstufe dennoch unverzerrt darstellen zu können müsste der Computer das Bild neu berechnen und zwischen den Punkten interpolieren. Dieses Verfahren könnte aber prinzipbedingt nie zu einer fehlerfreien Darstellung führen. Andere nicht verzerrende Vergrößerungsstufen liegen immer bei einem quadratischen Vielfachen des Bildpunktes, welchen sie vergrößern, zum Beispiel bei neun Bildpunkten (3^2) oder 16 Bildpunkten (4^2). Fehlerfreie Vergrößerung funktioniert also nicht stufenlos. Schön wäre es, man könnte die Größe der quadratischen Bildpunkte selbst verändern. Dies ist aber nur auf einem Röhrenmonitor durch eine Veränderung der Auflösung möglich, bei LCDs ist die Anzahl und Größe der Bildpunkte konstant. Um die Bildpunkte von vorne herein so groß wie nur möglich zu machen, empfiehlt es sich für sehbehinderte Menschen ohnehin, mit großformatigen Monitoren zu arbeiten und die Bildschirmauflösung nicht höher einzustellen als von den Programmen erwartet. (Zur Orientierung, aktuelle Programme unter Windows XP gehen für eine optimale Darstellung von einer Bildschirmauflösung von mindestens 1024x768 Bildpunkten aus.) Je stärker man die Bildschirminhalte vergrößert, um so mehr fällt auf, dass sich das Bild aus Quadraten zusammensetzt. Bei rechteckigen Bildschirmelementen wie Knöpfen oder Bildlaufleisten stört das wenig, bei Schrift verschlechtert dieser "Klötzcheneffekt" aber, vor allem bei runden Buchstaben die Lesbarkeit. Verschnörkelte Schriftarten mit vielen Rundungen und solche mit Serifen sind hiervon besonders betroffen. Daher bemüht sich Bildschirmvergrößerungssoftware, die Schrift durch das Einfügen von Schrägen etwas zu glätten. Perfekt dargestellt wird sie dadurch immer noch nicht, aber sie gewinnt an Lesbarkeit. Um die Lesbarkeit noch weiter zu verbessern benutzt man am besten schlichte, geradlinige Schriftarten ohne Serifen, wie zum Beispiel Arial. Beim Schreiben längerer Texte empfiehlt es sich für sehbehinderte Menschen, nur den Schrifttyp innerhalb der Textanwendung zu vergrößern und auf Bildschirmvergrößerungssoftware während des Schreibens zu verzichten. Wird die Schrift auf diese Art vergrößert, enthält sie mehr Details und bleibt leserlich.
Genau wie eine Lupe aber auch immer nur einen Ausschnitt des Ganzen anzeigen kann, so kann auch jede Bildschirmvergrößerungssoftware immer nur einen Teil des Gesamtbildes anzeigen. Es muss also möglich sein, diesen Ausschnitt zu verändern. Hierfür bietet gängige Bildschirmvergrößerungssoftware mehrere Möglichkeiten. So lässt sich einstellen, dass der vergrößerte Ausschnitt den ganzen Bildschirm einnimmt und sich mit der Maus bewegt oder dem Cursor folgt. Auch eine Zweiteilung des Bildschirms ist möglich. So kann zum Beispiel die obere Bildschirmhälfte das vergrößerte Bild darstellen, während auf der unteren Bildschirmhälfte der normale Bildschirm sichtbar ist. Dies erleichtert die Orientierung im Betriebssystem ungemein. Um blendempfindliche Sehbehinderte zu unterstützen, bieten Vergrößerungsprogramme auch häufig die Möglichkeit die Bildschirmfarben umzukehren, sodass statt schwarzem Text auf weißem Untergrund weißer Text auf schwarzem Untergrund steht. Manche Bildschirmvergrößerungssoftware arbeitet zugleich auch als kleine Version eines Screenreaders und gibt mit Hilfe einer Sprachausgabe zusätzliche Informationen akustisch aus.
Texterkennung
Unter Texterkennung versteht man die im Alltag angewandte Form der optischen Zeichenerkennung. Zeichenerkennung selbst ist "die Anwendung von Mustererkennungsmethoden auf die Form von Zeichen, die in einen Computer eingelesen wurden. Mit Hilfe der Zeichenerkennung wird bestimmt, welche alphanumerischen Zeichen (Buchstaben und Zahlen) oder Interpunktionszeichen durch die Formen dargestellt werden." (Microsoft Encarta 2001) Um es umgangssprachlicher auszudrücken: Ein gedruckter Text wird mit Hilfe eines optischen Lesegeräts (Scanner, Digitalkamera oder Ähnliches) in den Computer eingelesen. Der Computer erhält so ein digitales Abbild des Ursprungstextes, welches für ihn zunächst gleichwertig mit einer Fotografie ist. Die Zeichenerkennungssoftware versucht nun, auf diesem Abbild Textblöcke finden und ihre Ausrichtung sowie ihre logische Reihenfolge zu bestimmen. Alle gängigen Programme bieten dem Nutzer zusätzlich die Möglichkeit, hier selbst Hand anzulegen und dem Computer bei der Erkennung von Textblöcken zu helfen. Im nächsten Schritt vergleichen Algorithmen jede einzelne gefundene Form mit einer Tabelle aller Alphanumerischen- und Interpunktionszeichen, die der Erkennungssoftware bekannt sind. Das jeweils ähnlichste wird ausgewählt und die Software fährt mit der nächsten Form fort. Nachdem so alle Formen einem Zeichen zugeordnet worden sind, überprüft die Software im nächsten Schritt den so entstandenen Text mit Hilfe eines Wörterbuchs auf Fehler und berichtigt ihn. Erst nach dieser Korrekturphase ist der Erkennungsvorgang abgeschlossen. Für eine gute Erkennungsleistung muss dem Programm also nach Möglichkeit schon vor dem Beginn der Erkennungsphase die Textsprache bekannt sein. Ist sie es nicht, versuchen manche Programme, sie anhand der gefundenen Wörter selbst herauszufinden. Problematisch wird dies bei Texten, die viele Fremdwörter enthalten. Daher lässt sich meist auch einstellen, dass der Nutzer bei strittigen Wörtern vom Computer nach der richtigen Lösung gefragt wird. Der Vergleich mit dem Wörterbuch ist deshalb so wichtig, da es nicht immer eine eindeutige Zuordung von Form und Zeichen gibt. So sehen sich zum Beispiel die Zeichen 1 (Zahl) und l (kleiner Buchstabe L) in der weit verbreiteten Schriftart Times New Roman in ihrem Druckbild derart ähnlich, dass sie sehr leicht verwechselt werden können. Überhaupt ist eine gute Erkennungsleistung sehr stark vom verwendeten Schrifttyp der Vorlage abhängig. Die besten Ergebnisse erzielt man mit gängigen Schriftarten wie zum Beispiel Arial oder Times New Roman bei Schriftgrößen ab 10. Besonders schlecht erkannt werden schnörkelige Schriften mit dünnen Schmucklinien. Auch die Papierqualität übt starken Einfluss auf das Endergebnis aus.
Schmutziges, farbiges, geknicktes oder Umweltpapier verringern den Kontrast und verursachen störende Punkte auf dem in den Computer einzulesenden Bild. Da der Computer nicht wie unser Gehirn sofort entscheiden kann, dass diese Punkte Störungen sind, die es herauszufiltern gilt, erkennt er sie im ungünstigsten Fall als eigenständige Zeichen. Um Störungen dieser Art zu vermeiden, wenden viele Zeichenerkennungprogramme vor dem eigentlichen Erkennungsvorgang Bildreinigungsfilter auf das Ausgangsmaterial an. Diese arbeiten aber nicht immer erfolgreich und können durch zu forsche Bildkorrekturen die Erkennungsleistung sogar herabsetzen. Auch die Auflösung, mit der die Vorlage in den Computer eingelesen wurde, beeinflusst die Erkennungsleistung. Sinnvollerweise sollte diese nicht zu niedrig gewählt werden (erst Werte ab 150 dpi sind bei normalen Text sinnvoll), damit dünne Linien nicht einfach "übersehen" werden. Zu hohe Auflösungen wiederum verursachen lange Erkennungszeiten und erhöhen die Gefahr, dass Papierverschmutzungen als Zeichen erkannt werden.
In den letzten Jahren hat die optische Zeichenerkennung riesige Fortschritte gemacht und ihre Erkennungsleistungen ständig gesteigert. Programme erkennen Textblöcke recht zuverlässig selbst und müssen nur in wenigen Fällen beim Nutzer nachfragen. Zusätzlich bieten viele Programme die Möglichkeit, den erkannten Text auch im Layout der Vorlage nachzuempfinden und Bilder miteinzubetten. Für einfach gestaltete Textseiten reicht es heute aus den Computer zur Erkennung anzuweisen und nach einer kurzen Wartezeit das Ergebnis zu begutachten, ohne dass weitere Arbeitsschritte des Benutzers notwendig wären. Für sehgeschädigte Menschen bedeutet dies einen verhältnismäßig komfortablen Zugang zu einer Fülle von Schwarzschriftpublikationen. Für sehgeschädigte Menschen, welche nicht gerne direkt mit Computern arbeiten, existieren eine Reihe von Vorlesesystemen, die sich komfortabel bedienen lassen und den erkannten Text über Sprachausgabe wiedergeben. Vorlesesysteme benutzen zwar die gleiche Technik wie die Computer, aber ihre Bedienoberflächen sind noch weiter auf einfache Bedienung optimiert. Im einfachsten Fall legt man eine zu erkennende Vorlage ein und drückt einen Knopf. Nach kurzer Wartezeit beginnt das System automatisch den erkannten Text vorzulesen.
Spracherkennung
"Spracherkennung, [ist] die Fähigkeit eines Computers, gesprochene Wörter zu verstehen, um von der sprechenden Person Befehle und Eingabedaten zu empfangen." "Entwickler von Spracherkennungssystemen haben drei Richtungen beschritten: Ein möglicher Weg ist das Erkennen einer kleinen Anzahl von Wörtern, die von einem großen Spektrum von Menschen gesprochen werden. Diese Methode hat sich als ziemlich gut erwiesen. Die zweite Methode ermöglicht die Erkennung einer größeren Zahl von Wörtern, die von einer bestimmten Person ausgesprochen werden. Diese Methode ist recht zuverlässig, wenn die Sprachmuster der sprechenden Person gleichmäßig sind. Die dritte Methode versetzt den Computer in die Lage, die Sprachmuster der sprechenden Person zu lernen und diese Muster auf eine Vielzahl von Wörtern anzuwenden. Obwohl diese letzte Methode den größten Erfolg für eine vollständige Sprach-Text-Umwandlung verspricht, arbeitet sie doch am wenigsten zuverlässig." (Suchbegriff: Spracherkennung, in: Microsoft® Encarta® Enzyklopädie (2001))
In den letzten Jahren gab es in dieser Computerdisziplin beachtliche Fortschritte. Waren die ersten Programme lediglich dazu in der Lage, sorgfältig und streng voneinander getrennt ausgesprochene Worte aus einem sehr knappen Wortinventar zu erkennen und bedurften sie dazu eines intensiven Trainings, so können heutige Programme flüssig vorgetragenen Text mit hoher Erkennungsrate und mit vergleichsweise geringem Trainingsaufwand verarbeiten. Durch den enormen Leistungsanstieg im Computerbereich während der letzten Jahre reichen heute handelsübliche Computer für diese Arbeit vollkommen aus. Lediglich an die Qualität der Mikrofone werden immer noch hohe Anforderungen gestellt. Spracherkennung kann die Arbeit am Computer in zweierlei Hinsicht erleichtern. Sie kann zur Steuerung von Programmen oder zur Texteingabe benutzt werden. Beide Anwendungsgebiete werden von heutigen Betriebssystemen aber noch nicht standardmäßig ausgenutzt, was sich aber in den nächsten Jahren durchaus ändern könnte. Für behinderte Menschen beinhaltet diese Entwicklung zugleich positive und negative Möglichkeiten. Bedenklich ist, dass durch eine weite Verbreitung von Spracherkennungsprogrammen der klassische Arbeitsbereich der Schreibhilfskraft, die auf Tonband diktierte Texte in den Computer eingibt, auf längere Sicht verschwinden könnte. Ein Chance ist es, da durch Spracherkennung eine weitere Alternative zur Maus entsteht und gerade für Menschen mit Lähmungen ein zur Tastatur alternativer Zugangsweg zum Computer geschaffen wird. Spracherkennung könnte, sobald die dafür erforderliche Technik entsprechen miniaturisiert ist, außerdem das Kassettenaufnahmegerät ablösen. Denn einmal erkannter Text bietet gegenüber aufgenommener Sprache den Vorteil, dass er sich extrem platzsparend speichern lässt und auf vielerlei Art wieder ausgeben werden kann, so zum Beispiel auch auf einem Brailledrucker.
