Wir lieben Daten!

Unsere Arbeits­weise

Evidence-based Data Analysis für Ihren Erfolg

Ihr Projekt

Wir unterstützen Sie dabei, Ihre Projekte umzusetzen. Data Science ist die Schlüsselkompetenz die Ihnen hilft die Zukunft zu gestalten.

Ihre Daten

Mit bewährten Algorithmen, Modellen und Analysemethoden aus der Praxis und unseren innovativen neuen Modellierungen aus der Forschung unterstützen wir Sie bei Ihren Projekten.

Unsere Lösungen

Ob statistische Analyse, Machine Learning, Künstliche Intelligenz oder Knowledge Graphen, bauen Sie auf unsere Erfahrungen und schaffen neue Chancen.

 

Finden Sie mit uns Ihre Lösung


 

Über uns

Praxisnahe Lösungen


 

Graph-Datenbanken

In Graph-Datenbanken dreht sich alles um Suchen und Entdecken, was auf natürliche Weise geschieht. Bei der Abfrage berücksichtigt die graphbasierte Datenbank die gesamte Struktur der verfügbaren verbundenen Daten und liefert Ihnen detailliertere Ergebnisse. Darüber hinaus erhalten sie z.B. einen vertieften Einblick in die Beziehungen ganzer Branchen, um auf Basis dieser Erkenntnisse ihre Geschäftsmodelle zu optimieren und neue Produkte zu entwickeln.

High-Performance Datenanalyse

High Performance Data Analytics (HPDA) verwendet High Performance Computing (HPC) in Kombination mit Datenanalyse, um Muster und Erkenntnisse zu ermitteln. Mit dem Aufkommen von Hochleistungs-Cloud-Computing und Datenanalyse konnten extrem große Datenmengen in Echtzeit abgefragt werden.

Predictive Analytics

Predictive Analytics ist der Prozess, bei dem vergangene Daten verwendet werden, um zukünftige Trends vorherzusagen. Im einfachsten Fall bedeutet dies, historische Daten zu verwenden, um ein Modell zu erstellen, das wichtige Muster erfasst. Das Modell kann dann neue Daten verwenden, um zukünftige Entwicklungen vorherzusagen.

  • Graph Analytics
  • Compute Intensive Analytics
  • Streaming Analytics
  • Exploratory Data Analysis

Datensemantik

Das Problem der Datensemantik besteht darin, die Korrespondenz zwischen einer Datenquelle und ihrem beabsichtigten Gegenstand herzustellen und aufrechtzuerhalten. Erhalten Sie genaue Einblicke aus mehreren Datenquellen, um die Entscheidungsfähigkeit Ihres Unternehmens zu verbessern.

KI-getriebene Datenmodellierung

Intelligentes Datenmanagement als Basis für Data Science und den Einsatz Lernender Systeme. Neue Arten von Analysen wie maschinelles Lernen über neue Datenquellen die im Data Lake gespeichert sind, helfen ihnen, Geschäftswachstumschancen schneller zu erkennen und zu nutzen, die Produktivität zu steigern, Geräte proaktiv zu warten und fundierte Entscheidungen zu treffen.

Performance Intelligence

Performance Intelligence bietet mehr betriebliche Agilität und Belastbarkeit für Branchen, indem sie die Leistungsfähigkeit von Informationen und künstlicher Intelligenz (KI) mit menschlichen Erkenntnissen verbindet.

Business Intelligence

Unsere Business Intelligence Tools und Services helfen Ihnen um Daten in umsetzbare Erkenntnisse zu wandeln, die in die strategischen und taktischen Geschäftsentscheidungen ihres Unternehmens einfließen.

Text Analytics

Neben Zahlen ist ein Text wesentlicher Bestandteil der geschäftlichen Tätigkeit. Wichtig sind Erkenntnisse wie Stimmungsanalysen, Entitäten, Beziehungen und Schlüsselphrasen in unstrukturiertem Text aufzudecken. Mittels NLP, KI und Graphdatenbanken gelingt dies es diese Erkenntnisse in Strategien und Handlungen umzusetzen.

Ihre Ansprech­partner

Dieter Heermann

Prof. Dr. Dieter Heermann

Chief Data Scientist

Jens Hertel

Jens Hertel

Lead Software Engineer

 


 

Neues

Blog

passivehouse health
 

 

Eine eingehende Analyse der Passivhaus-Hashtags auf Twitter zeigt, dass der Schwerpunkt auf Energie statt auf Gesundheit liegt

Die Verwendung von Begriffen im Zusammenhang mit Passivhaus und insbesondere die Verwendung des Begriffs „build“ macht die Diskussionen und Themenschwerpunkte deutlich. Hier stellen wir kurz eine Analyse vor, die auf etwa zwei Monaten Twitter-Daten basiert.

Betrachten wir die Häufigkeitsverteilung von Begriffen, die in Verbindung mit dem Begriff „build“ verwendet werden. Diese Verteilung ist vom Typ Potenzgesetz! Eine solche Beobachtung scheint typisch für das gemeinsame Auftreten von Hashtags zu sein und kann die Form eines Small-World-Netzwerks annehmen. Dies ist im Einschub des Diagramms zur Verteilungsfunktion in einem Log-Log-Plot dargestellt. Die rote Linie zeigt den Fit an eine Potenzgesetz mit negativem Exponenten b.

passivehouse frequency diagram

Zur Erinnerung, eine Potenzgesetzverteilung weist die Eigenschaft der Skaleninvarianz auf. Wir hätten erwarten können, dass die Verteilung der Terme exponentiell ist, ein sehr schneller Zerfall der Terme, d. h. nur sehr wenige Terme sind relevant.

Eine skaleninvariante Verteilung hat die Eigenschaft, dass alle Verteilungen mit dem gleichen Exponenten b tatsächlich gleich sind, in dem Sinne, dass bei einer Neuskalierung der x-Achse, also s*x, die Verteilung invariant bleibt. Nehmen wir den Begriff „health“. Dann zeigt die Analyse den gleichen Exponenten b wie für den Term „build“!

Um dies zu demonstrieren, betrachten wir die „build“-Verteilung in Form eines Wissensgraphen, wie in Abbildung 2 gezeigt. Dies sieht sehr unordentlich aus und zeigt nicht viele Informationen und Strukturen. Lassen Sie uns das genauer untersuchen und nur die Begriffe (Knoten im Diagramm) verwenden, die mindestens 10 Verbindungen zu anderen Begriffen haben. Diese Begriffe sind die am häufigsten verwendeten Begriffe in Kombination (siehe Abbildung 3).

passivehouse knowledge graph

passivehouse knowledge graph

Abbildung 3 zeigt viel mehr Struktur. Die Größe des Textes gibt den Umfang der Konnektivität an. Daher steht „greenbuilding“, keine Überraschung hier, im Mittelpunkt, neben den verschiedenen Schreibweisen wie „buildings“, „building“ etc., die wir zusammenfassen.

Als nächstes folgen “sustainablebuilding(s)” und “healthybuilding(s). Dies ist eine interessante Beobachtung. Hinsichtlich der Gesundheit wird unterschieden. Tatsächlich zeigt eine weitere Analyse, dass sich eine Diskussionslinie um Themen wie die Luftqualität in Passivhäusern dreht. In diesem Zusammenhang sind auch die Begriffe "buildingperformance”und “buildingmaterials” zu sehen, die eine nachrangiger Begriffsverwendung haben.

An Bedeutung folgt “energyefficiency” mit einem großen Block wie “buildingscience”, “climateaction”, “buildingdesign” und “netzero”, die alle die Auswirkungen auf unser Klima und den Energieverbrauch betonen. Eine Sentimentanalyse zeigt, dass sich ein Großteil der negativen Stimmung auf gesundheitliche Aspekte in Gebäuden bezieht, insbesondere im Bildungsbereich.

Der gesundheitliche Aspekt wird durch den Begriff “ventilation” wieder aufgegriffen. In Abbildung 4 ist die recht komplizierte Diskussion zum Thema Gesundheit dargestellt.

passivehouse health

Es zeigt deutlich die Bedenken und die Probleme, die diskutiert werden. Die Hauptthemen sind “publichealth”, “healthyschools”, “mentalhealth” and “wellness”. Vor allem für öffentliche Gebäude, wie Schulen, in denen ein starker Trend zur Passivhausgestaltung und -bauten festzustellen ist, wird dies diskutiert. Die zentrale Diskussion dreht sich jedoch eher um Energieverbrauch und Klimawirkung, als um die Gesundheit.









passivehouse
 

 

Passivhaus (Passivhaus): Eine Fallstudie zur Datenanalyse und deren Potenziale

Wie kann man die Leistungsfähigkeit der Datenanalyse am besten demonstrieren? Lassen Sie uns ein bestimmtes Anwendungsfeld erkunden, um die Leistungsfähigkeit der Techniken zu demonstrieren und Geschäftsanwendungen vorzustellen.

Die Domäne rund um das Thema Passivhaus deckt ein breites Themenspektrum ab. Diese reichen von ökologischen, sozialen und gesellschaftlichen bis hin zu ingenieurwissenschaftlichen Themen. Selbst innerhalb eines Themas wartet ein ziemlich riesiger Data Lake auf jeden, der einigermassen das Feld abdecken möchte. Viele Daten liegen in Textform vor. Es ist sehr zeitaufwändig, genaues Wissen aus der riesigen Literatur zu gewinnen, und es ist notwendig, die Literatur in strukturiertes Wissen umzuwandeln, um ein effizientes Management der Daten sowie die Extraktion von Geschäftswissen und -handlungen zu gewährleisten. Viele haben bereits festgestellt, dass es ziemlich ineffizient ist, nützliche Informationen und Wissen aus dem massiven und verrauschten Klartext zu gewinnen, der für das tägliche Geschäft sowie für Domänenforschungsaktivitäten benötigt wird, um der Konkurrenz einen Schritt voraus zu sein. Hier kommen semantische Textanalyse, künstliche Intelligenz und Wissensgraphen zur Datenintegration, -analyse und -interpretation ins Spiel.

In einer Reihe von kurzen Artikeln zeigen wir, wie Datenanalysetechniken angewendet werden. Gezeigt werden Business Cases zur semantischen Datenanalyse und insbesondere Wissensgraphen. Wir werden weiter in den sozialen Aspekt eintauchen, indem wir die sozialen Daten analysieren, die mit dem Thema einhergehen.

Teil 1: Beispiele von Anwendungsfällen

Ausgangspunkt sind Informationen (Daten) aus unterschiedlichen heterogenen Quellen und heterogenen Datenformaten. Diese Quellen und Formate können Produktdatenblätter, Artikel, wissenschaftliche Artikel, Meinungsartikel, Tweets, Blogeinträge, … oder sogar numerische Datensätze sein. Je nach Art der Anwendung und der benötigten Daten sind die Möglichkeiten schier endlos. Meistens sind diese Datenquellen innerhalb des Unternehmens verstreut und ruhen in nicht zugänglichen Silos oder sind auf verschiedene Arten von physischen Quellen und Datenformaten verstreut. Wir möchten die vielen Quellen in einer „Datenbank“ aggregieren und zugänglich machen, um zum Beispiel aus der resultierenden Struktur Rückschlüsse zu ziehen, Abhängigkeiten abzuleiten, das Ergebnis abzufragen etc. Mehr dazu in den späteren Teilen dieser Serie. Die Datenmenge ist so groß, dass wir die Daten nicht manuell zusammenstellen und auch nicht manuell kuratieren und kommentieren können.

Darüber hinaus wollen wir über die Möglichkeiten hinausgehen, die generische Datenbanken bieten. Denken Sie daran, dass Sie für eine Datenbank Tabellen usw. angeben müssen, d.h. wir müssen jedes Detail im Voraus kennen und spezifizieren. Wir bekommen also nichts Neues. Stellen Sie sich vor, wir spezifizieren nur teilweise ein Framework, wie zum Beispiel einen Namensraum, der im Laufe der Zeit wachsen würde und die Struktur selbst sich weiterentwickeln ließe. Irgendwann, nachdem sich die „Datenbank“ gefüllt hat, können wir damit beginnen, Strukturen zu erkennen und Schlussfolgerungen aus der Struktur zu ziehen, d.h. die verborgene Verflechtung von Daten, die nicht von vornherein offensichtlich oder vorsätzlich war.

Beginnen wir diese Reihe mit der Benennung einiger Anwendungsfälle für Datenanalyse und Wissensgraphen. Natürlich haben wir noch nicht definiert, was wir unter einem Wissensgraphen verstehen. Operativ stellen wir uns einen Wissensgraphen als groß angelegtes semantisches Netzwerk vor, das die strukturierte Speicherung komplexer miteinander verbundener Daten realisieren kann. Beachten Sie, dass es hier verschiedene Bedeutungsebenen von 'Semantik' gibt, jedoch verschieben wir diese Diskussion im Moment, die für die Anwendungen in verschiedenen Geschäftsfällen hilfreich sein wird.

Lassen Sie uns nun über die Anwendung sprechen, nachdem wir die Daten gesammelt und verarbeitet haben. Hier ist eine Sammlung einiger offensichtlicher Anwendungsfälle

  • Interne Wissensdatenbank. Diese Anwendung kann sich auf Business Knowledge Management beziehen, intern oder extern. Dabei können die Datenquellen aus den internen Organisationseinheiten selbst stammen. Oder denken Sie an das Sammeln von Informationen und Wissen, das sich auf das jeweilige Geschäft bezieht, um die Konkurrenz zu übertreffen.
  • Wissensdatenbank als Service. Es ist üblich, aggregierte Daten als Service anzubieten. Google ist natürlich der prototypische Fall für einen Anbieter von Allgemeinwissen. Es gibt jedoch auch speziellere Anbieter, angefangen von der Finanzindustrie, Verlagen wie Elsevier oder Springer, bis hin zur Gesundheitsbranche.
  • Industrieller Wissensgraph. Im industriellen Umfeld unterstützen Knowledge Graphen die unternehmensweite Digitalisierung.
  • Expertisen schreiben. Für detailliertes und fundiertes Fachwissen ist eine Wissensdatenbank eine conditio sine qua non. Mit dem Aufkommen von Wissensgraphen wurde dem Bereich ein erheblicher Schub verliehen, der die Messlatte für das bereitgestellte Fachwissen höher legt.
  • Marktforschung. Ein naheliegender Fall ist beispielsweise die Identifizierung von Marktstrukturen.

Die oben genannten Anwendungsfälle sind ihrer Natur nach passiv. Der Wissensgraph ist eine aggregierte Ressource, die darauf wartet, angezapft zu werden. Im aktiven Anwendungsfall eines Wissensgraphen ist der Graph selbst Teil einer Anwendung. Betrachten Sie ein Passivhaus Smart Home. In diesem Szenario ist der Wissensgraph Teil des Netzwerks von Sensoren und Geräten und beteiligt sich aktiv an der Regulierung, etwa der Heizung oder Lüftung des Hauses zusammen eventuell mit KI (Künstliche Intelligenz) aufbauend auf dem erworbenen Wissen.

Eine letzte Anwendung, die wir kurz ansprechen, ist das Opinion Mining über verschiedene Quellen hinweg. Für eine nachhaltige Tragwerksplanung muss neben Fakten oft auch eine Meinung in den Entscheidungs- und Planungsprozess einfließen. Sei es das Material, das man in einem Passivhausbau verwendet oder der Entwurf selbst. Wissensgraphen helfen, meinungsaggregierende Informationen und Meinungen durch den Prozess der Extraktion und Erfassung von Beziehungen und deren Anreicherung mit Netzwerkdaten zu identifizieren.

Im zweiten Teil dieser Serie werden wir die verschiedenen Datenquellen und die Extraktion semantischer Daten zum Aufbau eines Wissensgraphen diskutieren und was es im Voraus mit sich bringt.

Kontakt

Rufen Sie uns an (Tel. 06223 - 9258-58)
oder senden Sie uns eine E-Mail!