Bild

Technologische Entwicklungen & Trends frühzeitig erkennen


 
REMARK
dreamstime © Stepan Popov

In technologie- und forschungstreibenden Unternehmen ist die Technologiefrüherkennung Teil des strategischen Innovations- und Technologie-Managements. Ziel ist es, aussichtsreiche Technologieansätze oder -trends zu ermitteln und deren Entwicklungspotential zu beurteilen. Technologische Entwicklungen und Trends müssen identifiziert, technologische Möglichkeiten rechtzeitig erkannt und deren Auswirkungen und Bedeutung für das Unternehmen bewertet werden. Auch die Identifikation bereits angewandter technischer Lösungen in anderen Anwendungen und Branchen vor dem Hintergrund der Übertragung dieser auf das eigene Produktspektrum und Anwendungsfeld, stellen Unternehmen vor enorme Herausforderungen in Form zeitlicher und personeller Ressourcen.

Ausgangspunkt für die Technologiefrüherkennung ist der generelle Informationsbedarf:  
Wie wird die Menge an zur Verfügung stehenden Informationen über neue Technologien (z.B. aus Fach-Datenbanken, Patenten, wissenschaftlichen Veröffentlichungen) effizient und schnell bewältigt?

Wie kann mein Unternehmen frühzeitig die relevanten technologischen Möglichkeiten identifizieren?

Welche neuen Technologien zeichnen sich als Substitutionsgefahr ab oder ermöglichen neue Funktionalitäten für die eigenen Produkte?

Wie ist deren Leistungsfähigkeit in Bezug auf das eigene Anwendungsgebiet einzuschätzen? Wie ist der Reifegrad zu beurteilen?


Semantische Informations- und Analysewerkzeuge


 
REMARK
dreamstime © Gajus

Die manuelle Analyse gefundener Dokumente ist sehr zeitintensiv. Somit macht es Sinn, für diese Suchprozesse spezialisierte, software-basierte Recherche- und Monitoring-Werkzeuge zu verwenden, die eine schnelle und zielgerichtete Extraktion relevanter Informationen aus digitalen Texten ermöglichen. Hierzu erfolgt eine semantische Anreicherung der Texte (Semantic Content Enrichment) um Metadaten. Diese können sein:

Personen, Orte, Firmen, spezifische Projekt- und Firmen-Terme und andere Annotationen.

Die durch software-basierte Extraktion gewonnenen Informationen haben den entscheidenden Vorteil, dass bei dieser Art von Analyse schnell große Mengen an Daten flexibel untersucht werden können. Nach der Identifikation und Extraktion müssen diese Informationen in einem zweiten Schritt noch durch Fachexperten beurteilt werden.

  • Angebundene Datenquellen:
    - Suchmaschinen (Google, Bing),
    - Publikations-/Fachdatenbanken (WTI),
    - Journale (JournalTOCs, ScienceDirect),
    - Patentdatenbanken (EPO — European Patent Office,
      USPTO — United States Patent and Trademark Office),
    - RSS-/News-Feeds,
    - im File-System abgelegte Dateien.
  • Einrichtung von Projekträumen:
    Themenfelder, in denen inhaltlich zusammengefasst Suchen in verschiedenen Datenquellen durchgeführt werden können (z.B. Technologien, Forschungsthemen, Marktanalysen (bezogen auf ein Themenfeld), Konkurrenzanalysen, eigenes Unternehmen).
  • Verarbeitung von PDF-, Text- und HTML-Dateien
  • Suche nach relevanten Dokumenten über key words / Zeitraum.
  • Berechnung der absoluten und relativen (Term frequency) Anzahl von Firmen– und Projekt-Termen zur Beurteilung der Relevanz eines Dokumentes
  • (Manuelle) Klassifizierung / Kategorisierung der relevanten Dokumente (interessante Dokumente, Literaturrecherche)
  • Einrichtung von ad-hoc- und zeitgesteuerten Suchen (Monitoring).
  • Automatische Erkennung von Dokumenten, die bereits im Projektraum annotiert sind (z.B. durch ähnliche Suchanfragen)
    - keine doppelte Annotierung.

  • Suche in den Dokumenten über firmen– und projektspezifische Begriffslisten: allgemeine Firmen-Terme, themen-spezifische Projekt-Terme.
  • Systemseitige Verwendung von Gazetteer-Listen und Regeln zur Annotierung/Text-Identifikation
  • GATE Standard-Annotationen: Personen, Organisationen, Datum, Zahlen, Währungen und andere Named Entities  (atomare Elemente im Text / Satz).
  • Extraktion / Annotation von Begriffen und auch Sätzen mit relevanten Informationen.
  • Analyse / Auswertung von Einzeldokumenten und auch Dokumenten-Corpora
  • Interaktive Übernahme von relevanten Textpassagen in Wissens-Datenbanken.

REMARK - Ein Software-Tool zur Recherche, Analyse und Auswertung von digitalen Texten

Eines der Projektergebnisse des Verbund-Forschungsprojektes syncTech (s.u.) ist das Recherche– und Monitoringtool REMARK.
Ziel bei der Entwicklung der Anwendung war die Realisierung eines interaktiven Werkzeuges zur Ausführung von Annotationsprozessen, sowie zur Analyse und Beurteilung von Ergebnissen der Informationsextraktion.

Für die grundlegenden Aufgaben der Informationsextraktion wird in REMARK das Software-System GATE (siehe unten) eingesetzt, eine freie Open Source Software-Plattform zur Extraktion von Informationen aus Texten.

Die Hauptaufgabe der Informationsextraktion ist die Identifikation und Annotierung von Begriffen in Texten (Named-Entity-Recognition). Hierzu wird eine semantische Anreicherung (Semantic Content Enrichment) der Texte um Metadaten wie Personen, Orte, Firmen, spezifische Projekt- und FirmenTerme u.a. ausgeführt.

Diese basiert zum einen auf Begriffs– bzw. Gazetteer-Listen. Zum anderen gibt es regelbasierte Formalismen, die Annotationen aufgrund von Wortarten und –stellungen und bereits in Sätzen vorhandenen Annotationen erzeugen.

Dies erfordert eine zuvor durchgeführte linguistische Analyse des Textes (Tokenizer, SentenceSplitter, Part-of-Speech-Tagger).

1. Suchanfrage an einen Dokumenten-Corpus

Ergebnisse einer (Annotationen-)Suchanfrage an einen Dokumenten-Corpus: Ausgabe aller Sätze, die genau zwei Projektterme enthalten

Suchanfrage

 

 

 

2. Suchanfrage an einen Dokumenten-Corpus

Ergebnisse einer (Annotationen-)Suchanfrage an einen Dokumenten-Corpus (JournalTOCs): Ausgabe aller Sätze, die genau drei Projektterme enthalten (siehe Spalte “match”). Filter auf die Begriffe in den Spalten match: “solar”,    after: “IEEE”

Filter

Ein entsprechender Suchprozess nach neuen Informationen geht in der Regel immer vom eigenen Anwendungsfeld aus. Sinnvoll ist aber auch im Sinne einer Cross-Industry-Innovation Technologien aufzufinden, die in anderen Anwendungsfeldern bereits eingesetzt werden.

Um relevante Dokumente in online Medien zu finden, die wichtige Inhalte enthalten könnten, beeinflussen zwei Punkte wesentlich die Qualität und Relevanz der zu analysierenden Dokumente:

  1. Die verfügbaren Datenquellen: Fachdatenbanken, Fachzeitschriften und –Journale, Patentdatenbanken, offene Suchmaschinen (indizierte Dokumente und Websites im Internet), RSS-Feeds, Presseportale.
  2. Die Bestimmung der „key words“, mit der eine Suche in der gewählten Datenquelle gestartet wird.

Weiterhin gibt es für die Suchprozesse zwei generelle Zielstellungen:

  1. Die Identifikation relevanter Dokumente:
    sind prinzipiell relevante Informationen in Bezug auf meine Suchstrategie in einem Dokument enthalten?
  2. Das Auffinden relevanter Textstellen in den gefundenen Dokumenten:
    welches sind im Dokument die interessantesten, relevantesten Textpassagen in Bezug auf das Themenfeld der Suche (Begriffe, Sätze, Absätze)?

Das Projekt syncTech - Synchronisierte Technologieadaption als Treiber der strategischen Produktinnovation.

Bild
Bild

Das Verbundprojekt syncTech ist Teil des Programms „Forschung für die Produktion von morgen“ zum Schwerpunkt „Innovative Produkte effizient entwickeln“ und ist dem Themenfeld „Strategische Entwicklung von Produkt-innovationen“ des Förderschwerpunktes zugeordnet.

Im Rahmen dieses Projektes sollen produzierende Unternehmen dabei unterstützt werden, neue Methoden und Werkzeuge zu entwickeln und einzuführen, die eine strategische Entwicklung von Produkt-Innovationen bzw. die Entwicklung innovativer Produkte und Produktionssysteme effizient ermöglichen.

Technologische Trends sollen frühzeitig erkannt werden, um die Entwicklungspotentiale für Innovationen rechtzeitig erschließen zu können.

 

Projekt-Koordination
Fraunhofer-Institut für Arbeitswirtschaft und Organisation (IAO)
Nobelstraße 12
70569 Stuttgart

Herr Markus Korell

 

Laufzeit
01.03.2012 bis 28.02.2015
Förderkennzeichen: 02PJ1003
http://www.synctech-innovation.de

GATE (General Architecture for Text Engineering) ist ein text-technologisches System und Software Framework zur Informationsextraktion und linguistischen Verarbeitung von Text.
Es wird seit mehr als 15 Jahren an der University of Sheffield (GB) als frei erhältliche Open Source Software entwickelt.

Seine Architektur ermöglicht die Entwicklung und den Einsatz aufgabenorientierter Plugins ebenso wie die interaktive Nutzung über ein Graphical User Interface (GUI) und auch das Einbinden in bestehende Software über ein Application Programming Interface (API).
Siehe auch: https://gate.ac.uk