Scalytics Connect: Entwickeln Sie föderierte Apps für KI im Bankwesen und FinTech

Scalytics Connect ermöglicht eine sichere, föderierte Datenverarbeitung über mehrere Quellen hinweg, ohne den Datenschutz zu gefährden.

Zusammenfassung

Daten sind für die Finanzdienstleistungsbranche unerlässlich, um bessere Produkte und Dienstleistungen anzubieten, das Kundenerlebnis zu verbessern, Vorschriften einzuhalten und sich einen Wettbewerbsvorteil zu verschaffen. Der Umgang mit Datensilos ist jedoch eine große Herausforderung. Die Zentralisierung von Daten war die traditionelle Lösung, hat jedoch Nachteile wie hohe Kosten, Sicherheitsrisiken und Datenschutzbedenken. Die föderierte Datenverarbeitung bietet eine alternative Lösung, mit der die Datenkosten gesenkt und der Datenschutz und die Leistung von Finanzdienstleistungen verbessert werden können. Dies ist eine wichtige Überlegung, damit sich Institutionen in der Finanzbranche auszeichnen können.

Daten sind Grundlage der Finanzdienstleistungsbranche. Sie ermöglichen es Banken, Versicherungsunternehmen, Fintech-Startups und anderen Akteuren, bessere Produkte und Dienstleistungen anzubieten, das Kundenerlebnis zu verbessern, Vorschriften einzuhalten, sich einen Wettbewerbsvorteil zu verschaffen und auf wirtschaftliche Turbulenzen vorzubereiten. Daten sind jedoch auch mit Herausforderungen wie hohen Kosten, Sicherheitsrisiken und Datenschutzbedenken verbunden. Eine der größten Herausforderungen für die Finanzdienstleistungsbranche ist der Umgang mit Datensilos. Datensilos sind isolierte Datenpools, die von verschiedenen Abteilungen, Geschäftsbereichen oder Organisationen getrennt gespeichert und verarbeitet werden. Datensilos können den Datenaustausch, die Zusammenarbeit und Innovation behindern und die Datenduplizierung, Inkonsistenz und Komplexität erhöhen.

Heute besteht die herkömmliche Lösung um Datensilos zu eliminieren darin, Daten in einem einzigen Repository zu zentralisieren, z. B. in einem Data Warehouse oder einem Data Lake. Dieser Ansatz hat jedoch auch Nachteile, wie zum Beispiel:

  • Hohe Kosten: Die Zentralisierung von Daten erfordert erhebliche Investitionen in Infrastruktur, Speicherung, Verarbeitung und Wartung. Für sensible Daten sind zusätzliche Backups an verschiedenen Standorten erforderlich, was kostspielig sein kann.
  • Sicherheitsrisiken: Die Zentralisierung von Daten führt zu einer einzigen Fehlerquelle und ist ein verlockendes Ziel für Hacker und Cyberkriminelle.
  • Bedenken hinsichtlich des Datenschutzes: Die Zentralisierung von Daten kann gegen Datenschutzgesetze oder -vorschriften wie die Allgemeine Datenschutzverordnung (DSGVO) oder den California Consumer Privacy Act (CCPA) verstoßen, die die Erfassung, Verarbeitung und Übertragung personenbezogener Daten über Grenzen oder Gerichtsbarkeiten hinweg einschränken.
  • Skalierbarkeit und Leistung der Daten: Wenn das Geschäft wächst, steigt die Datengeschwindigkeit. Bei der Zentralisierung von Daten mangelt es an Flexibilität, um mit steigenden Datenmengen umgehen zu können, was in der Regel die Qualität oder Genauigkeit der Ergebnisse beeinträchtigt.
  • Datensilos und Fragmentierung: Wenn Sie mit mehreren Datenquellen zu tun haben, die an unterschiedlichen Orten, Formaten und Systemen gespeichert sind, erschwert die Zentralisierung von Daten den zeitnahen und konsistenten Zugriff auf, die Integration und Analyse Ihrer Daten. Zu den weiteren Problemen gehören komplexe ETL-Prozesse zur Reduzierung von Datenduplizierung, Inkonsistenz und Unvollständigkeit.

Um diese Herausforderungen zu bewältigen, zeichnet sich ein neuer Ansatz ab: föderierte Datenverarbeitung und Datennetzarchitekturen. Die föderierte Datenverarbeitung ist eine Technik, die die Extraktion von Erkenntnissen aus mehreren isolierten Datensätzen ermöglicht, ohne dass diese Daten gemeinsam genutzt oder in ein zentrales Repository oder einen Server verschoben werden müssen. Die föderierte Datenverarbeitung nutzt verteiltes Rechnen, Datennetze und maschinelles Lernen, um Datenanalysen an verschiedenen Standorten durchzuführen und gleichzeitig den Datenschutz und die Datensicherheit zu wahren — wir nennen dies „Federated Data Lakehouse“. Ein Federated Data Lakehouse ist eine Ebene über bestehenden Datenarchitekturen wie Data Lakes, Delta Lakes, Datenbanken, Dateispeichern wie S3 oder Dateien wie Excel und vereint all diese Datenquellen auf einer kombinierten Datenplattform.

Prinzipien der föderierten Datenverarbeitung: Data Mesh-Prinzipien und logische Architektur

Das Federated Data Lakehouse bietet der Finanzdienstleistungsbranche mehrere Vorteile, wie zum Beispiel:

  • Geringere Datenkosten: Durch die föderierte Datenverarbeitung entfällt die Notwendigkeit, große Datenmengen zentral zu speichern und zu verarbeiten, wodurch bis zu 35% der Datenkosten.
  • Verbesserter Datenschutz: Die föderierte Datenverarbeitung stellt sicher, dass personenbezogene oder sensible Daten an ihrem ursprünglichen Speicherort verbleiben und weder Dritten noch unbefugtem Zugriff ausgesetzt sind.
  • Höhere Datenqualität: Die föderierte Datenverarbeitung ermöglicht es Dateneigentümern, die Kontrolle und das Eigentum an ihren Daten zu behalten und deren Richtigkeit, Vollständigkeit und Aktualität sicherzustellen.
  • Verbesserte Dateninnovation: Die föderierte Datenverarbeitung ermöglicht es Dateneigentümern, zusammenzuarbeiten und Erkenntnisse über verschiedene Bereiche und Organisationen hinweg auszutauschen, ohne ihre Datensouveränität oder Wettbewerbsfähigkeit zu gefährden.

Um zu veranschaulichen, wie Scalytics Connect in der Praxis funktioniert, präsentieren wir zwei reale Anwendungsfälle aus der Finanzdienstleistungsbranche.

Fallbeispiel: Ein föderiertes Datawarehouse für die Kreditbewertung

Die Kreditbewertung ist ein Prozess, bei dem die Kreditwürdigkeit eines Kreditnehmers anhand seiner finanziellen Historie, seines Verhaltens und anderer Kriterien bewertet wird. Die Kreditbewertung wird von Kreditgebern wie Banken oder Fintech-Unternehmen verwendet, um zu bestimmen, ob ein Kunde ein Konto eröffnen kann (KYC), ob ein Kreditantrag genehmigt werden kann, welcher Zinssatz berechnet werden muss und welches Kreditlimit angeboten werden soll.

Die Kreditbewertung stützt sich auf große Datenmengen aus verschiedenen Quellen wie Auskunfteien, Kontoauszügen, Social-Media-Profilen, Online-Transaktionen und mehr. Diese Quellen sind jedoch häufig fragmentiert und über verschiedene Organisationen und Gerichtsbarkeiten verteilt. Dies macht es für Kreditgeber schwierig, auf alle relevanten Daten für Kreditbewertungszwecke zuzugreifen und diese zu analysieren. Darüber hinaus können einige dieser Quellen persönliche oder sensible Informationen enthalten, die aus rechtlichen oder ethischen Gründen nicht weitergegeben oder übertragen werden können. Beispielsweise dürfen Auskunfteien aufgrund der DSGVO-Bestimmungen ihre Kreditauskünfte möglicherweise nicht an ausländische Kreditgeber weitergeben. Ebenso sind Social-Media-Plattformen aufgrund von Datenschutzrichtlinien möglicherweise nicht bereit, ihre Benutzerdaten an Dritte weiterzugeben.

Federated Datalakes können zur Lösung dieses Problems beitragen, indem sie es Kreditgebern ermöglichen, Kreditbewertungen für mehrere Datensätze durchzuführen, ohne die zugrunde liegenden Daten zu verschieben oder weiterzugeben. Zum Beispiel:

  • Ein Kreditgeber kann Federated Learning verwenden, eine Art der föderierten Datenverarbeitung, bei der maschinelle Lernmodelle auf verteilte Datensätze angewendet werden, um ein Kreditbewertungsmodell anhand von Daten mehrerer Auskunfteien zu trainieren, ohne auf deren individuelle Kreditauskünfte zugreifen zu müssen.
  • Ein Kreditgeber kann Federated Analytics verwenden, eine andere Art der föderierten Datenverarbeitung, bei der statistische Analysen über verteilte Datensätze hinweg durchgeführt werden, um aggregierte Kennzahlen wie Durchschnittseinkommen, Schuldenquote oder Ausfallrate anhand von Daten aus mehreren Kontoauszügen zu berechnen, ohne auf seine einzelnen Transaktionen zugreifen zu müssen.
  • Ein Kreditgeber kann Verbundabfragen verwenden, eine weitere Art der föderierten Datenverarbeitung, bei der Abfragen über verteilte Datensätze ausgeführt werden, um relevante Informationen wie Bildungsniveau, Beruf oder Größe des sozialen Netzwerks mithilfe von Daten von mehreren Social-Media-Plattformen abzurufen, ohne auf seine individuellen Profile zugreifen zu müssen.

Das GDPR konforme Federated Data Lakehouse von Scalytics Connect verwendet föderierte Datenverarbeitungstechniken und eine Datennetzarchitektur, um Kreditgebern zu helfen, die Genauigkeit und Effizienz ihrer Kreditwürdigkeit zu verbessern und gleichzeitig ihre Datenkosten zu senken und ihren Datenschutz zu verbessern.

Fallbeispiel: Ein föderierter Data Lakehouse für den Börsenhandel

Die föderierte Datenverarbeitung ist eine Technik, die es mehreren Parteien ermöglicht, bei der Datenanalyse zusammenzuarbeiten, ohne ihre Rohdaten gemeinsam nutzen zu müssen. Dies kann dazu beitragen, Datenschutz, Sicherheit und Compliance zu wahren und gleichzeitig datengestützte Erkenntnisse und Innovationen zu ermöglichen. Wir zeigen einen häufigen Anwendungsfall, der aufzeigt wie Scalytics Connect dazu beiträgt, eine Handelsplattform in der Finanzdienstleistungsbranche zu verbessern. Eine Tradingplattform ist eine Bankeninterne Plattform, die verschiedene Marktteilnehmer in mehreren geografischen Regionen miteinander verbindet, wie z. B. Makler, Händler, Börsen und Clearinghäuser. Die Plattform ermöglicht es ihnen, Geschäfte auszuführen, Bestellungen zu verwalten und Transaktionen abzuwickeln. Die Plattform steht jedoch vor einigen Herausforderungen in Bezug auf Datenqualität, Latenz und Skalierbarkeit. Zum Beispiel:

  • Die Auftragsinformationen aus verschiedenen Quellen können inkonsistent, unvollständig oder veraltet sein, was zu Fehlern oder Verzögerungen bei der Auftragsabstimmung und Ausführung führen kann.
  • Die Transaktionsinformationen von verschiedenen Handelsplätzen können fragmentiert, laut oder ungenau sein, was die Sichtbarkeit und Liquidität des Marktes beeinträchtigt.
  • Die Depotinformationen verschiedener Banken können vertraulich, sensibel oder reguliert sein, was den Datenaustausch und die Integration einschränkt.

Um diesen Herausforderungen zu begegnen, kann die Handelsplattform föderierte Datenverarbeitung und Datamesh-Technologie nutzen, um eine parteiübergreifende Datenzusammenarbeit zu ermöglichen, ohne den Datenschutz oder die Datenhoheit zu gefährden. Dazu gehören:

  • Die Handelsinformationen können mithilfe von Federated Learning (FL) auf föderierte Weise verarbeitet werden. Dies ermöglicht es mehreren Parteien, ein gemeinsames maschinelles Lernmodell mit ihren lokalen Daten zu trainieren, ohne sie zu übertragen. Auf diese Weise kann die Plattform die Transaktionsinformationen von verschiedenen Handelsplätzen aggregieren und analysieren, ohne deren Rohdaten zu sammeln.
  • Die Auftragsinformationen können mithilfe der sicheren Mehrparteienberechnung (SMPC) auf föderierte Weise verarbeitet werden, sodass mehrere Parteien gemeinsam eine Funktion für ihre Eingaben berechnen können, ohne sie preiszugeben. Auf diese Weise kann die Plattform die Bestellinformationen aus verschiedenen Quellen validieren und abgleichen, ohne auf ihre Rohdaten zugreifen zu müssen.
  • Die Verwalterinformationen können mithilfe der homomorphen Verschlüsselung (HE) föderiert verarbeitet werden, was es einer Partei ermöglicht, Berechnungen mit verschlüsselten Daten durchzuführen, ohne sie zu entschlüsseln. Auf diese Weise kann die Plattform die Depotinformationen verschiedener Banken integrieren und abfragen, ohne deren Rohdaten preiszugeben.

Durch die Implementierung von Scalytics Connect als Federated Data Lakehouse kann die Handelsplattform des Unternehmens ihre Leistung, Funktionalität und Wettbewerbsfähigkeit in der Finanzdienstleistungsbranche verbessern. Es kann auch neue Möglichkeiten für die Monetarisierung von Daten, Innovation und Zusammenarbeit zwischen verschiedenen Marktteilnehmern schaffen.

Data Mesh und die Abstraktion von Datenplattformen sind keine Patentrezepte oder Einheitslösungen. Sie erfordern eine sorgfältige Planung, Gestaltung, Implementierung und Verwaltung. Sie erfordern auch einen Kulturwandel von zentralem zu dezentralem Dateneigentum und Zusammenarbeit. Scalytics Connect bietet eine vielversprechende Vision, wie Unternehmen die Macht der Daten nutzen können, um ihren Anbietern, Partnern und Stakeholdern einen besseren Nutzen zu bieten. Führen Sie unbedingt ein kurzes Beratungsgespräch mit Ihrem Scalytics Vertreter, um die Herausforderungen der Implementierung von Scalytics Connect in Ihre Datenstrategien zu besprechen.

Über Scalytics

Da die Anforderungen an die moderne KI-Entwicklung steigen, haben traditionelle ETL-Plattformen Schwierigkeiten, Schritt zu halten, da sie durch ihre eigenen Einschränkungen in Bezug auf Datenbewegungen und Verarbeitungsgeschwindigkeit blockiert werden. Scalytics Connect ist die Lösung der nächsten Generation, die speziell für die Optimierung von KI-Trainings durch innovative Datenintegrationsfunktionen entwickelt wurde.

Wir ermöglichen es Ihnen, datengestützte Entscheidungen in Minuten statt Tagen zu treffen
Scalytics ist basierend auf Apache Wayang, und wir sind stolz darauf, das Projekt zu unterstützen. Du kannst dir ihr öffentliches GitHub-Repo hier ansehen. Wenn Dir unsere Software gefällt - ein Star ⭐ würde viel bedeuten!

Wenn Sie professionelle Unterstützung von unserem Team von branchenführenden Experten benötigen, können Sie sich jederzeit an uns über Slack oder E-Mail wenden.

Starten Sie noch heute mit Scalytics Connect

Thank you! Our team will get in touch soon.
Oops! Something went wrong while submitting the form.