(21.07.2014)Hagi schrieb: Und was ist der erste?
Hat hier nix mit dem Thema zu tun, aber ich finde, dass es keine gute Übersicht über die deutschen FFs gibt (und ja, ich kenne die Liste)
(21.07.2014)Hagi schrieb: Grundsätzlich wäre so n Script schon cool, das Problem was ich aber mit Ebook Convertern bisher immer hatte war, dass sie mir die Formatierung zerschossen haben, wie läuft das bei deinem Script? Nutzt es den Ebook-Download von Google Docs oder macht es was anderes?
Das Script lädt die Texte von Google Docs als HTML/ZIP-Packet runter, entpackt das HTML, entfernt diverse HTML-Tags damit es weniger Problemquellen gibt (kein CSS mehr, keine Bilder mehr), die Überschriften innerhalb eines Google Docs Dokuments werden jeweils eine Überschriftenebene tiefer gemacht und der Dokumenttitel als Haupt-(Kapitel-)Überschrift gesetzt.
Die grundlegenden Sachen, Absätze,
Schiefstellungen und
Fettschrift, Zentrierungen und diverse sollten erhalten bleiben.
Ein paar Nerdfakten, falls jemand was mit dem Wirrwarr anfangen kann ^^ Das hier ist die Zeile, die die oben genannte Umwandlung durchführt
Code:
less $FILE
| sed -r "s/<style.*<\/style>//g" # CSS entfernen
| sed -r "s/<[\/]?html>//g" # <html>-Tag entfernen
| sed -r "s/\s*class=\"[a-zA-Z0-9_ ]*\"[\s ]*//g" # CSS entfernen
| sed "s/h3>/h4>/g" | sed "s/h2>/h3>/g" | sed "s/h1>/h2>/g" # Überschriften umnummerieren
| sed -r "s/<meta[^>]*>//g" # <meta>-Tag entfernen
| sed -r "s/<[/]?span>//g" # CSS entfernen
| sed -r "s/<[/]?body>//g" | sed -r "s/<[/]?head>//g" #<head> und <body> entfernen
| sed -r "s/<p><\/p>//g" # leere Absätze entfernen
| sed "s/<title>/<h1 class=\"chapter\">/g" #Dokumenttitel zu Kapitelüberschrift machen
| sed "s/<\/title>/<\/h1>/g"
| sed "s/<img[^>]*>//g" # Bilder entfernen
| sed "s/<span[^>]*>//g" # CSS entfernen
| sed "s/<a name[^>]>//g" # "keine Ahnhung was das ist, aber es macht das Layout kaputt"-entfernen
Die so bearbeiteten HTML-Dateien werden in eine gemeinsame HTML-Datei gepackt und von einem Konvertierungsprogramm in ein Ebook-Format gewandelt. Dabei wird dann auch ein Inhaltsverzeichnis erstellt, ein Titelbild und Beschreibung können hinzugefügt werden etc.
Abgesehen von dem, was das Konvertierungsprogramm tut kann ich das Skript natürlich noch anpassen. Also z.B. wenn zu viel der Formatierung verloren geht.
Ich kann gerne mal eine Geschichte konvertieren und hier bereitstellen, so zum Test. Ich will nur nicht über irgendwessen Schulter ein FF-Ebook hier hochladen
Noch eine Sache, das Skript läuft nur auf Linux und ist im Zweifelsfall nicht gerade benutzerfreundlich. Von daher schreibt einfach, wenn ich etwas konvertieren soll. Das ist für mich eine Arbeit von einer Minute.