Text zusammenfassen Musterlösung

0 Flares 0 Flares ×

Es wird der Schluss gezogen, dass Strukturinformationen der robusteste Indikator für Salience sind und semantische Sinne semantische Semantik bietet nur Einschränkungen bei der Inhaltsauswahl. Sense-Features helfen jedoch, eine verbesserte Leistung zu erzielen. Außerdem ergänzen die Graphenstruktur von Text und semantische Sinnesinformationen nichtdiskursale Merkmale. Abbildung 2.6. Ein intuitiver Vergleich zwischen dem automatischen Zusammenfassungsergebnis und den antiken Gemälden. Links oben: Collage von Felszeichnungen in der Bronzezeit (en.wikipedia.org/wiki/Nordic_Bronze_Age). Rechts oben: Dunhuang Wandmalerei (public.dha.ac.cn, das Muster war beliebt in der Han-Dynastie, 206 v. Chr.-220 n. Chr.). Links unten: ein Gemälde eines 7-jährigen modernen chinesischen Kindes (Sirui Zhuge).

Low-Right: ein Ergebnis der Zusammenfassung. Das multimodale semantische Modell erfasst die Konzepte und bildet die Beziehung zwischen diesen Konzepten, die sowohl Text als auch Bilder darstellen, die in multimodalen Dokumenten enthalten sind. Ein semantisches Modell wird zunächst mithilfe einer Wissensdarstellung basierend auf Objekten erstellt. Knoten stellen Konzepte dar, und Verknüpfungen zwischen diesen Konzepten stellen eine Beziehung zwischen ihnen dar. Wichtige Ideen werden anhand der Datendichtemetrik bewertet, die die Vollständigkeit, die Beziehung zu anderen und die Anzahl der Vorkommen eines Ausdrucks überprüft. Die gewählten Konzepte werden schließlich in Sätze umgewandelt, um eine Zusammenfassung zu erstellen. Ein Beispiel für ein solches System ist SimpleNLG, das Schnittstellen bietet, um eine direkte Kontrolle über die Art und Weise zu bieten, wie Phrasen erstellt und kombiniert werden, inflektionalen morphologischen Operationen und Linearisierung. In der jüngsten Vergangenheit hat NLP einen Anstieg von Deep-Learning-basierten Modellen erlebt, die eine Eingabesequenz in eine andere Ausgabesequenz zuordnen, die sequenziellen Modellen genannt wird, die bei Problemen wie der maschinellen Übersetzung (Bahdanau et al., 2014), der Spracherkennung (Bahdanau et al., 2015) und der Videobeschriftung (Venugopalan et al., 2015) erfolgreich waren. Trotz der Ähnlichkeiten ist die abstrakte Zusammenfassung jedoch ein ganz anderes Problem als die maschinelle Übersetzung: In der Zusammenfassung ist der Zieltext in der Regel sehr kurz und hängt nicht sehr stark von der Länge der Quelle ab. Noch wichtiger ist, dass es in der maschinellen Übersetzung eine starke Eins-zu-Eins-Wort-Ebene zwischen Quelle und Ziel gibt, aber in der Zusammenfassung ist es weniger einfach.

Die Diskursanalyse beinhaltet die Umwandlung menschlichen Textes innerhalb eines Diskurses in eine interne Maschinendarstellung, weiter in Abschnitt 5.6.4. Zu den jüngsten Arbeiten in diesem Bereich gehören die Textzusammenfassung im medizinischen Bereich (Afantenos et al., 2005), empirische Methoden in der Textzusammenfassung (Das und Martins, 2007), die Erhebung der Extraktions-basierten Textzusammenfassung und text mining (Gupta und Lehal, 2009, 2010). In Louis et al. (2010) werden spezifische Aspekte des Diskurses analysiert, die den stärksten Hinweis auf die Textbedeutung liefern. Sie untersuchen sowohl die Graphenstruktur des Textes, der durch Diskursbeziehungen bereitgestellt wird, als auch den semantischen Sinn dieser Beziehungen im Kontext der Inhaltsauswahl für die Zusammenfassung einzelner Dokumente. Die NL-Generierung umfasst die Produktion natürlicher Sprache von einer internen Computerdarstellung zu geschriebenem Text oder gesprochenem Ton (Abbildung 5.18, von rechts nach links). Dieser Prozess zerfällt oft in drei Operationen: Textplanung (Makroplanung des Textinhalts), Satzplanung (Mikroplanung der Organisation auf Satzebene) und Satzrealisierung (grammatikalisches Rendering in linearer sensentialer Form). Die oberflächliche Ähnlichkeit zwischen Text und Data Mining verbirgt reale Unterschiede. Im Vorwort (Seite xxi) charakterisierten wir Data Mining als Extraktion impliziter, bisher unbekannter und potenziell nützlicher Informationen aus Daten. Beim Textmining werden die zu extrahierenden Informationen jedoch klar und explizit im Text angegeben.

0 Flares 0 Flares ×
0 Flares 0 Flares ×