Lesen Sie MS Word-Dokumente in Ihrem Terminal [Linux]
Microsoft Word-Dokumente, die in Geschäftsumgebungen fast allgegenwärtig sind, könnten für Linux-Benutzer als notwendiges Übel angesehen werden, mit dem sie umgehen müssen. Natürlich können Sie Word-Dateien in LibreOffice öffnen, aber es ist mühsam, darauf zu warten, dass eine umfangreiche Grafikanwendung Ihr Dokument lädt. Antiword ist eine Lösung, die auf Ihrem Terminal läuft – perfekt für Leute mit langsamen Computern oder Systemen ohne grafische Umgebung.
Antiword wurde auf FreeBSD, BeOS, OS/2, Mac OS X, Amiga, VMS, NetWare, Plan9, EPOC, Zaurus PDA, MorphOS, Tru64/OSF, Minix, Solaris und DOS portiert. In diesem Artikel konzentriere ich mich auf die Verwendung unter Linux.
Haupteigenschaften
Mit Antiword können Sie MS Word-Dokumente über die Befehlszeile anzeigen und konvertieren. Sie können in die folgenden Formate konvertieren:
- Klartext
- Formatierter Text
- Nachtrag
- XML (nur DocBook wird derzeit unterstützt)
Einschränkungen
Bevor Sie sich zu sehr aufregen, muss ich erwähnen, dass Antiword zuletzt im Jahr 2005 aktualisiert wurde und nicht mit neueren DOCX-Dokumenten kompatibel ist. Sie können es auch nicht zum Bearbeiten Ihrer Dokumente verwenden.
Antiwort bekommen
Wenn Ihre Linux-Distribution über einen Paketmanager verfügt, finden Sie Antiword höchstwahrscheinlich in einem Ihrer Repositorys.
Andernfalls holen Sie sich das .tar.gz-Archiv aus dem Antiword-Seite auf Freecode. Extrahieren Sie das Archiv und geben Sie das Verzeichnis antiword-0.37 ein. Dann renne:
Verwendung
Für die folgenden Anwendungstipps verwende ich meinen Lebenslauf als Beispieldokument. So sieht es in LibreOffice aus:
Die einfachste Möglichkeit, Antiword zu verwenden, besteht darin, das Dokument einfach anzuzeigen:
Wie Sie sehen können, behält der Standardbefehl bestimmte Formatierungsaspekte wie Schriftgröße, Kursivschrift und Unterstreichung nicht bei, leistet aber gute Arbeit bei der Darstellung des Textes in einer lesbaren Form.
Um Formatierungsinformationen anzuzeigen, verwenden Sie das Flag „-f“ in Ihrem Befehl:
Nein, das ist eigentlich nicht der Fall zeigen Sie die Formatierung im WYSIWYG-Stil; vielmehr, es erzählt Sie darüber mit einer Markdown-ähnlichen Syntax. Beispielsweise wird _unterstrichener Text_ mit Unterstrichen und *fetter Text* mit Sternchen angezeigt.
Um Ihr Word-Dokument in eine PDF-Datei zu konvertieren, müssen Sie mit dem Flag „-a“ ein Papierformat angeben. Antiword unterstützt die folgenden Papierformate:
- 10×14
- a3
- a4
- a5
- b4
- b5
- Exekutive
- Folio
- legal
- Brief
- Notiz
- Quart
- Stellungnahme
- Boulevardzeitung
Sie können beim Konvertieren eines Dokuments in Postscript dieselben Papierformate verwenden, müssen in diesem Fall jedoch stattdessen das Flag „-p“ verwenden.
In diesem Beispiel wird das Dokument in eine PDF-Datei im Tabloidformat konvertiert:
antiword -a tabloid summary.doc > summary-tabloid.pdfDies ist die resultierende PDF-Datei, die in Okular angezeigt wird:
Nicht schlecht! Die gepunktete Unterstreichung und der Hyperlink zur E-Mail-Adresse verschwanden, aber insgesamt war die Konvertierung erfolgreich.
Wenn Sie in Postscript konvertieren, können Sie auch das „-L“ verwenden, um im Querformat zu drucken.
In diesem Beispiel wird das Dokument in das DocBook-Format konvertiert:
antiword -x db resume.doc > resume-docbook.docbookBei der Konvertierung bleiben auch Metadaten erhalten, einschließlich des Namens des Autors und des Erstellungsdatums des Dokuments. So sieht das Roh-XML aus:
Und so sieht die DocBook-Datei in LibreOffice aus:
Man sieht, dass es anders aussieht als das ursprüngliche Word-Dokument, die Struktur jedoch größtenteils erhalten geblieben ist. Die Konvertierung in DocBook mit Antiword würde wahrscheinlich besser mit Word-Dokumenten funktionieren, die mit Blick auf die Konvertierung in XML erstellt wurden.
Um zu sehen, was Sie mit Antiword sonst noch tun können – einschließlich der Wiederherstellung von Text, der in MS Word geändert wurde – schauen Sie sich die Manpage an (sie ist auch online).
Schreibe einen Kommentar