Passivhaus (Passivhaus): Eine Fallstudie zur Datenanalyse und deren Potenziale
Wie kann man die Leistungsfähigkeit der Datenanalyse am besten demonstrieren? Lassen Sie uns ein bestimmtes Anwendungsfeld erkunden, um die Leistungsfähigkeit der Techniken zu demonstrieren und Geschäftsanwendungen vorzustellen.
Die Domäne rund um das Thema Passivhaus deckt ein breites Themenspektrum ab. Diese reichen von ökologischen, sozialen und gesellschaftlichen bis hin zu ingenieurwissenschaftlichen Themen. Selbst innerhalb eines Themas
wartet ein ziemlich riesiger Data Lake auf jeden, der einigermassen das Feld abdecken möchte. Viele Daten liegen in Textform vor.
Es ist sehr zeitaufwändig, genaues Wissen aus der riesigen Literatur zu gewinnen, und es ist notwendig, die Literatur in strukturiertes Wissen umzuwandeln, um ein effizientes Management der Daten sowie die Extraktion von Geschäftswissen und -handlungen zu gewährleisten.
Viele haben bereits festgestellt, dass es ziemlich ineffizient ist, nützliche Informationen und Wissen aus dem massiven und verrauschten Klartext zu gewinnen, der für das tägliche Geschäft sowie für Domänenforschungsaktivitäten benötigt wird, um der Konkurrenz einen Schritt voraus zu sein. Hier kommen semantische Textanalyse, künstliche Intelligenz und Wissensgraphen zur Datenintegration, -analyse und -interpretation ins Spiel.
In einer Reihe von kurzen Artikeln zeigen wir, wie Datenanalysetechniken angewendet werden. Gezeigt werden Business Cases zur semantischen Datenanalyse und insbesondere Wissensgraphen. Wir werden weiter in den sozialen Aspekt eintauchen, indem wir die sozialen Daten analysieren, die mit dem Thema einhergehen.
Teil 1: Beispiele von Anwendungsfällen
Ausgangspunkt sind Informationen (Daten) aus unterschiedlichen heterogenen Quellen und heterogenen Datenformaten. Diese Quellen und Formate können Produktdatenblätter, Artikel, wissenschaftliche Artikel, Meinungsartikel, Tweets, Blogeinträge, … oder sogar numerische Datensätze sein. Je nach Art der Anwendung und der benötigten Daten sind die Möglichkeiten schier endlos. Meistens sind diese Datenquellen innerhalb des Unternehmens verstreut und ruhen in nicht zugänglichen Silos oder sind auf verschiedene Arten von physischen Quellen und Datenformaten verstreut. Wir möchten die vielen Quellen in einer „Datenbank“ aggregieren und zugänglich machen, um zum Beispiel aus der resultierenden Struktur Rückschlüsse zu ziehen, Abhängigkeiten abzuleiten, das Ergebnis abzufragen etc. Mehr dazu in den späteren Teilen dieser Serie. Die Datenmenge ist so groß, dass wir die Daten nicht manuell zusammenstellen und auch nicht manuell kuratieren und kommentieren können.
Darüber hinaus wollen wir über die Möglichkeiten hinausgehen, die generische Datenbanken bieten. Denken Sie daran, dass Sie für eine Datenbank Tabellen usw. angeben müssen, d.h. wir müssen jedes Detail im Voraus kennen und spezifizieren. Wir bekommen also nichts Neues. Stellen Sie sich vor, wir spezifizieren nur teilweise ein Framework, wie zum Beispiel einen Namensraum, der im Laufe der Zeit wachsen würde und die Struktur selbst sich weiterentwickeln ließe. Irgendwann, nachdem sich die „Datenbank“ gefüllt hat, können wir damit beginnen, Strukturen zu erkennen und Schlussfolgerungen aus der Struktur zu ziehen, d.h. die verborgene Verflechtung von Daten, die nicht von vornherein offensichtlich oder vorsätzlich war.
Beginnen wir diese Reihe mit der Benennung einiger Anwendungsfälle für Datenanalyse und Wissensgraphen. Natürlich haben wir noch nicht definiert, was wir unter einem Wissensgraphen verstehen. Operativ stellen wir uns einen Wissensgraphen als groß angelegtes semantisches Netzwerk vor, das die strukturierte Speicherung komplexer miteinander verbundener Daten realisieren kann. Beachten Sie, dass es hier verschiedene Bedeutungsebenen von 'Semantik' gibt, jedoch verschieben wir diese Diskussion im Moment, die für die Anwendungen in verschiedenen Geschäftsfällen hilfreich sein wird.
Lassen Sie uns nun über die Anwendung sprechen, nachdem wir die Daten gesammelt und verarbeitet haben. Hier ist eine Sammlung einiger offensichtlicher Anwendungsfälle
- Interne Wissensdatenbank. Diese Anwendung kann sich auf Business Knowledge Management beziehen, intern oder extern. Dabei können die Datenquellen aus den internen Organisationseinheiten selbst stammen. Oder denken Sie an das Sammeln von Informationen und Wissen, das sich auf das jeweilige Geschäft bezieht, um die Konkurrenz zu übertreffen.
- Wissensdatenbank als Service. Es ist üblich, aggregierte Daten als Service anzubieten. Google ist natürlich der prototypische Fall für einen Anbieter von Allgemeinwissen. Es gibt jedoch auch speziellere Anbieter, angefangen von der Finanzindustrie, Verlagen wie Elsevier oder Springer, bis hin zur Gesundheitsbranche.
- Industrieller Wissensgraph. Im industriellen Umfeld unterstützen Knowledge Graphen die unternehmensweite Digitalisierung.
- Expertisen schreiben. Für detailliertes und fundiertes Fachwissen ist eine Wissensdatenbank eine conditio sine qua non. Mit dem Aufkommen von Wissensgraphen wurde dem Bereich ein erheblicher Schub verliehen, der die Messlatte für das bereitgestellte Fachwissen höher legt.
- Marktforschung. Ein naheliegender Fall ist beispielsweise die Identifizierung von Marktstrukturen.
- …
Die oben genannten Anwendungsfälle sind ihrer Natur nach passiv. Der Wissensgraph ist eine aggregierte Ressource, die darauf wartet, angezapft zu werden. Im aktiven Anwendungsfall eines Wissensgraphen ist der Graph selbst Teil einer Anwendung. Betrachten Sie ein Passivhaus Smart Home. In diesem Szenario ist der Wissensgraph Teil des Netzwerks von Sensoren und Geräten und beteiligt sich aktiv an der Regulierung, etwa der Heizung oder Lüftung des Hauses zusammen eventuell mit KI (Künstliche Intelligenz) aufbauend auf dem erworbenen Wissen.
Eine letzte Anwendung, die wir kurz ansprechen, ist das Opinion Mining über verschiedene Quellen hinweg. Für eine nachhaltige Tragwerksplanung muss neben Fakten oft auch eine Meinung in den Entscheidungs- und Planungsprozess einfließen. Sei es das Material, das man in einem Passivhausbau verwendet oder der Entwurf selbst. Wissensgraphen helfen, meinungsaggregierende Informationen und Meinungen durch den Prozess der Extraktion und Erfassung von Beziehungen und deren Anreicherung mit Netzwerkdaten zu identifizieren.
Im zweiten Teil dieser Serie werden wir die verschiedenen Datenquellen und die Extraktion semantischer Daten zum Aufbau eines Wissensgraphen diskutieren und was es im Voraus mit sich bringt.