Bearbeiten Sie HTML- und XML-Dateien über die Commnad-Zeile
Das World Wide Web Consortium (W3C) stellt eine Reihe kostenloser Tools zur Verfügung, die bei der korrekten Generierung und Verarbeitung von HTML- und XML-Dateien helfen. Der HTML-XML-Paket ist eine Reihe einfacher Dienstprogramme zum Bearbeiten von HTML- und XML-Dateien über die Befehlszeile. Es ist für viele der verschiedenen Linux-Distributionen verfügbar und kann für diejenigen nützlich sein, die regelmäßig HTML- oder XML-Dateien verarbeiten müssen.
Um das Paket unter Ubuntu zu installieren, verwenden Sie:
sudo apt-get install html-xml-utilsDieses Paket enthält 31 Tools. Hier finden Sie eine Zusammenfassung ihrer Funktionen:
- cexport – Headerdatei der exportierten Deklarationen aus einer C-Datei erstellen
- hxaddid – IDs zu ausgewählten Elementen hinzufügen
- hxcite – Ersetzen Sie bibliografische Verweise durch Hyperlinks
- hxcite-mkbib – Referenzen erweitern und Bibliographie erstellen
- hxcopy – Kopieren Sie eine HTML-Datei unter Beibehaltung relativer Links
- hxcount – Elemente und Attribute in HTML- oder XML-Dateien zählen
- hxextract – Ausgewählte Elemente extrahieren
- hxclean – Heuristik anwenden, um eine HTML-Datei zu korrigieren
- hxprune – markierte Elemente aus einer HTML-Datei entfernen
- hxincl – Erweitern Sie die enthaltenen HTML- oder XML-Dateien
- hxindex – erstellt einen alphabetisch sortierten Index
- hxmkbib – Bibliographie aus einer Vorlage erstellen
- hxmultitoc – Erstellen Sie ein Inhaltsverzeichnis für eine Reihe von HTML-Dateien
- hxname2id – Verschieben Sie einige ID= oder NAME= von A-Elementen zu ihren übergeordneten Elementen
- hxnormalize – Pretty-Print einer HTML-Datei
- hxnum – Abschnittsüberschriften in einer HTML-Datei nummerieren
- hxpipe – XML in ein Format konvertieren, das einfacher mit Perl oder AWK analysiert werden kann
- hxprintlinks – Links nummerieren und URL-Tabelle am Ende einer HTML-Datei hinzufügen
- hxremove – ausgewählte Elemente aus einer XML-Datei entfernen
- hxtabletrans – transponiert eine HTML- oder XHTML-Tabelle
- hxtoc – Fügt ein Inhaltsverzeichnis in eine HTML-Datei ein
- hxuncdata – CDATA-Abschnitte durch Zeichenentitäten ersetzen
- hxunent – Ersetzen Sie vordefinierte HTML-Zeichenentitäten durch UTF-8
- hxunpipe – Konvertiert die Pipe-Ausgabe zurück in das XML-Format
- hxunxmlns – Ersetzen Sie „globale Namen“ durch XML-Namespace-Präfixe
- hxwls – Links in einer HTML-Datei auflisten
- hxxmlns – XML-Namespace-Präfixe durch „globale Namen“ ersetzen
- asc2xml, xml2asc – Konvertieren zwischen UTF8 und Entitäten
- hxref – Querverweise generieren
- hxselect – Elemente extrahieren, die einem (CSS-)Selektor entsprechen
Um Ihnen die Leistungsfähigkeit dieses Toolsets vorzustellen, finden Sie hier einige Beispiele für die Verwendung einiger Befehle.
Der Befehl „hxnormalize“ formatiert eine HTML-Datei neu, sodass sie leicht lesbar und schön formatiert ist. Um diesen Befehl zu testen, erstellen wir einen hässlichen HTML-Code. Wählen Sie die folgenden Zeilen aus, kopieren Sie sie und fügen Sie sie direkt in ein Terminalfenster ein.
cat > test.html << __EOF__hello __EOF__
Dadurch wird eine Datei namens test.html erstellt. Dem HTML fehlen einige der schließenden Tags und er ist vollständig in einer Zeile geschrieben. Der Befehl hxnormalize formatiert die Datei neu und schreibt die hübsche Version in die Standardausgabe (stdout). So führen Sie den Befehl aus:
Das Flag „-e“ weist hxnormalize an, alle fehlenden schließenden Tags einzufügen.
Sie können den Befehl auch für eine Webseite ausführen, indem Sie „test.html“ durch eine URL ersetzen, zum Beispiel:
hxnormalize http://www.example.comDer Befehl hxwls analysiert eine lokale HTML-Datei oder eine Website und listet die Links im HTML auf. Zum Beispiel:
hxwls http://www.example.comHier sind die ersten Ausgabezeilen für die Make Tech Easier-Website:
Der Befehl hxtabletrans ändert eine Tabelle, sodass Zeilen zu Spalten und Spalten zu Zeilen werden.
Lassen Sie uns eine HTML-Datei mit einer einfachen Tabelle erstellen. Wählen Sie die folgenden Zeilen aus, kopieren Sie sie und fügen Sie sie dann direkt in ein Terminalfenster ein.
cat > table.html << __EOF__
Jill | Smith | 50 |
Eve< /td> | Jackson | 94 |
__EOF__
Das Ergebnis ist eine Datei namens table.html. In einem Webbrowser würde die Tabelle etwa so aussehen:
Jill | Schmied | 50 |
Vorabend | Jackson | 94 |
Wenn Sie den Befehl hxtabletrans ausführen, wird die transponierte Tabelle in die Standardausgabe geschrieben. Die Ergebnisse können wie folgt in eine andere Datei umgeleitet werden:
hxtabletrans table.html > table2.htmlDie neue Datei, table2.html, zeigt Jill Smith und Eve Jackson in Spalten und nicht wie im Original in Zeilen. Die resultierende Tabelle sieht etwa so aus:
Jill | Vorabend |
Schmied | Jackson |
50 | 94 |
Die meisten Befehle werden auf ähnliche Weise wie in den obigen Beispielen verwendet, dh Sie müssen eine zu verarbeitende Datei oder URL angeben und die Ausgabe wird in die Standardausgabe geschrieben. Versuchen Sie, mit den verschiedenen Befehlen zu experimentieren, da diese für Sie möglicherweise nützlich sind.
Wenn Sie Fragen zu den HTML-XML-Dienstprogrammen haben, können Sie diese gerne in den Kommentaren unten stellen und wir werden sehen, ob wir Ihnen helfen können.
Schreibe einen Kommentar