Senken Sie die Datenkosten mit Blossom Sky um bis zu 35%

March 29, 2023
-
Vatsal Shah
-

Mit dem KI-gestützten Federated Data Lakehouse von Blossom Sky können Sie Analysen, maschinelles Lernen (ML) und KI auf verschiedenen föderierten Datenquellen und Formaten ausführen, ohne Daten in zentrale Datenspeicher oder Data Lakes verschieben oder kopieren zu müssen. Die meisten unserer Kunden nutzen die Blossom Sky-Plattform, um ihre aktuellen Datenplattformen und Verarbeitungsmodule zu vereinheitlichen. Ein Virtual Data Lakehouse ermöglicht die dezentrale Verarbeitung und den föderierten Datenzugriff über eine Vielzahl von Datenquellen und Formaten. Es ermöglicht Benutzern, Analyse- und KI-Aufgaben direkt dort auszuführen, wo sich die Daten befinden, ohne sie verschieben oder kopieren zu müssen.

Blossom Sky von DataBloom kann Unternehmen dabei helfen, bis zu 35 Prozent ihrer aktuellen Datenausgaben wiederherzustellen und erneut bereitzustellen, indem ein besseres Datenmanagement auf Datenarchitektur-, Beschaffungs- und Nutzungspraktiken angewendet wird. Viele der empfohlenen Verbesserungen können mithilfe von Blossom Sky schnell umgesetzt werden, sodass Unternehmen innerhalb von sechs Monaten zweistellige Einsparungen erzielen. Unternehmen können erhebliche Einsparungen erzielen, indem sie ihren aktuellen Datenstapel mit Blossom Sky optimieren.

Senkung der Investitionskosten durch Vereinheitlichung vorhandener Datenplattformen

Wir analysieren Blossom im Vergleich zu den hochmodernen Apache Spark-Instances für Big-Data-Analysen. Wir haben in mehreren Forschungsartikeln berichtet, dass Apache Spark im Durchschnitt das schnellste Big-Data-System ist. Wir haben daher die Zeit- und Kostenvorteile von Blossom Sky mit Apache Spark verglichen. Die hier angegebenen Zeiteinsparungen stammen aus unseren Forschungsartikeln. Zur besseren Darstellung der Arbeitslasten der Benutzer betrachten wir drei Hauptarbeitslasten:

  • Textanalyse (z. B. Worthäufigkeit, Wortsynonyme, Erstellung inverser Indizes)
  • Datenanalyse (z. B. Aggregatabfragen und Join-Abfragen)
  • maschinelles Lernen (SGD, K-Means und gemeinschaftsübergreifender Pagerank)

Für diesen Vergleich haben wir eine einzelne AWS-Cloud-Instance von zwei gängigen Typen betrachtet: m4 (2,42 $/h) und T3 (8,786 $/h). Wir gehen davon aus, dass der Benutzer die Instanz 8 Stunden am Tag weiterlaufen lässt, um ihre Datenanalysen durchzuführen. Die folgende Tabelle veranschaulicht die Vorteile von Blossom in Bezug auf Zeit- und Kosteneinsparungen. Bemerkenswerterweise stellen wir fest, dass die Verwendung von Blossom Sky immer zu Zeit- und Kosteneinsparungen führt: Sie ermöglicht es den Benutzern sparen über 200.000$ pro Jahr in der oben genannten Einstellung.

Task

Time Savings

Cost Savings (USD)

Text Analytics Workload 5x  
Yearly Savings – m4 instance (8hrs/day)   $27,878.4
Yearly Savings – t3 instance (8hrs/day)   $101,214.72
Data Analytics Workload 2x  
Yearly Savings – m4 instance (8hrs/day)   $6,969.6
Yearly Savings – t3 instance (8hrs/day)   $25,303.68 
Machine Learning (AI) Workload 10x  
Yearly Savings – m4 instance (8hrs/day)   $62,726.4
Yearly Savings – t3 instance (8hrs/day)   $227,733.12

Reduzieren Sie die Betriebskosten und die Investitionskosten, indem Sie Ihren aktuellen Datenstapel wiederverwenden

Unserer Erfahrung nach entlasten Unternehmen ihre Mitarbeiter möglicherweise um ein Drittel, indem sie die Kosteneinsparungen bei der Einstellung von IT-Mitarbeitern ignorieren, und können ihre derzeitige Belegschaft sofort umschichten. Um beispielsweise einen Spark-Cluster mit 25 Knoten in AWS zu verwalten und etwa 5 KI-Beratungsprojekte durchzuführen, beträgt die typische Teamgröße insgesamt 14 Teammitglieder:

  • Backend-Entwickler (5)
  • Systemspezialisten (2)
  • Datenwissenschaftler//Datenanalyst (4)
  • Projektmanager (3)

Durch die Implementierung von Blossom Sky reduziert sich die durchschnittliche Teamgröße auf 7 Mitarbeiter:

  • Backend-Entwickler (2)
  • Systemspezialisten (1)
  • Datenwissenschaftler//Datenanalyst (2)
  • Projektmanager (2)

Dies führt auch zu erheblichen Kostensenkungen für das gesamte Unternehmen. Aufgrund der längeren Nutzung bereits vorhandener Datenverarbeitungsplattformen wie Hadoop oder Spark und seiner kommerziellen Versionen sparen unsere Kunden oft 35 bis 40% der Betriebskosten und im Durchschnitt mehr als 50% CapEx-Kosten, wenn sie Blossom Sky verwenden. Bitte beachten Sie, dass die Einsparungen bei den Betriebskosten umgehend umgeschichtet werden können, um mehr Projekte gleichzeitig voranzutreiben.

Über Scalytics

Da die Anforderungen an die moderne KI-Entwicklung steigen, haben traditionelle ETL-Plattformen Schwierigkeiten, Schritt zu halten, da sie durch ihre eigenen Einschränkungen in Bezug auf Datenbewegungen und Verarbeitungsgeschwindigkeit blockiert werden. Scalytics Connect ist die Lösung der nächsten Generation, die speziell für die Optimierung von KI-Trainings durch innovative Datenintegrationsfunktionen entwickelt wurde.

Wir ermöglichen es Ihnen, datengestützte Entscheidungen in Minuten statt Tagen zu treffen
Scalytics ist basierend auf Apache Wayang, und wir sind stolz darauf, das Projekt zu unterstützen. Du kannst dir ihr öffentliches GitHub-Repo hier ansehen. Wenn Dir unsere Software gefällt - ein Star ⭐ würde viel bedeuten!

Wenn Sie professionelle Unterstützung von unserem Team von branchenführenden Experten benötigen, können Sie sich jederzeit an uns über Slack oder E-Mail wenden.
back to all articlesFollow us on Google News
Schneller zum KI-Erfolg
Kostenlose White Paper. Erfahren Sie, wie Scalytics KI und ML optimiert und Unternehmen in die Lage versetzt, schnellere KI-Erfolge zu erzielen.

Starten Sie noch heute mit Scalytics Connect

Thank you! Our team will get in touch soon.
Oops! Something went wrong while submitting the form.