S explozí různých druhů dat se společnosti snaží realizovat smysluplnou hodnotu svých uložených dat. Datové týmy jsou přetížené – nuceny uspokojovat potřeby různých oddělení v rámci organizace a zároveň se snažit konzistentně udržovat datové zásady.
To je sdílená teze Shirshanky Das a Swaroop Jagadish, alespoň spoluzakladatelů Acryl Data, startupu poskytujícího nástroje, které firmám pomáhají organizovat a zdánlivě lépe spravovat jejich data. Acryl dnes oznámil, že získal 21 milionů dolarů v kole série A vedeném společností 8VC za účasti Sherpalo Ventures a Guillerma Raucha, zakladatele a generálního ředitele společnosti Vercel, čímž se celková částka zvýšila na 30 milionů dolarů.
Před spuštěním Acryl Data byl Das hlavním softwarovým inženýrem společnosti LinkedIn a předtím členem technických týmů nejprve ve společnosti PayPal a poté v Yahoo! (úplné zveřejnění: vlastník TechCrunch). Jagadish přišel do Acrylu prostřednictvím Airbnb a také LinkedIn a Yahoo!
„Acryl Data je komunitou řízená metadatová platforma, která poskytuje centrální ovládání napříč decentralizovaným datovým zásobníkem,“ řekl Jagadish, CEO, TechCrunch v e-mailovém rozhovoru. „S posláním vnést do dat jasnost nabízí Acryl datový katalog s řešeními pro zjišťování dat, správu, rodokmeny a pozorovatelnost.“
Co je to vlastně datový katalog? No, je to soupis datových aktiv v organizaci. Datové katalogy se skládají z metadat, ve kterých jsou uloženy definice databázových objektů, jako jsou základní tabulky, indexy, uživatelé a skupiny uživatelů.
Datové katalogy jsou tucet desetník – viz startupy jako Castor, Stemma, Select Star a Alation, které je nabízejí, abychom jmenovali alespoň některé. Jagadish však tvrdí, že přístup Acrylu nabízí několik klíčových výhod oproti soupeřům.
Hlavní z nich je platforma Acryl – která je postavena na open source frameworku DataHub – funguje na „událostmi řízených“ metadatech. Tím, že provádí operace pouze při spuštění, může Acryl snížit náklady na údržbu datového katalogu a zároveň umožnit řadu pracovních postupů založených na spouštěcích, tvrdí Jagadish.
„Exploze dat za poslední desetiletí vedla společnosti k tomu, aby přijaly řadu nových technologií, ale také vytvořila fragmentované datové prostředí,“ dodal. „Některé problémy se zjednodušily, jako je orchestrace dat, transformace, ukládání, přesun a vizualizace – ale další problémy se znovu objevily jako výzvy, jako je zjišťování dat, kvalita dat a správa dat. Pokusy o vyřešení problému – stejně jako tradiční nástroje pro správu a sledování – byly zbytečně utlumeny, což vedlo k další neefektivitě a nekonzistentním řešením… Acryl je navržen tak, aby pomohl týmům přejít od jednoduché viditelnosti dat k náhledu na data, od náhledu k akci a od akce k automatizaci .“
Kromě toho Acryl nabízí modul „observability“ určený pro sledování kvality dat v reálném čase. Modul, vhodně nazvaný Observe, sleduje a pokouší se odhalit problémy s kvalitou dat – teoreticky pomáhá předcházet poškození dat a umožňuje rychlejší řešení tam, kde k nim dojde.
Pomocí Acrylu mohou zákazníci také provádět testy metadat, které pokrývají oblasti pro optimalizaci nákladů, jako jsou drahá nebo málo využívaná datová aktiva. Konfigurovatelné monitory provádějící tyto testy umožňují uživatelům definovat a průběžně vyhodnocovat sadu podmínek pro datová aktiva v organizaci.
„Naším nejčastějším ‚konkurentem‘ je status quo vývoje na zakázku, protože datoví inženýři si sami zavádějí manuální procesy a protokoly, než aby implementovali více automatizované řešení,“ řekl Jagadish.
Acryl má do budoucna ambiciózní plány, včetně funkcí umělé inteligence, které „inteligentně spravují“ metadata a navrhují značky a termíny obchodního glosáře pro důkladnější dokumentaci datových katalogů. Kromě toho má společnost v úmyslu spustit nástroj založený na umělé inteligenci, který bude generovat souhrny popisující klíčové charakteristiky daného datového katalogu, jako je jeho spolehlivost a použití.
Acryl, který má 25 zaměstnanců, o své zákaznické základně příliš neprozradí. Startup ale odhalil, že mezi své klienty počítá Notion, Zendesk, Robinhood, OVO Energy, BetterUp a Riskified.
Das dodal, že DataHub, který založil na LinkedIn a který udržují zaměstnanci Acrylu, používají společnosti jako Pinterest, Stripe, Optum, Expedia, Saxo Bank a Peloton. Je optimistou, že funkce Acrylu postavené na DataHubu přesvědčí alespoň některé z nich, aby převedli.
„Rychlé tempo změn v datovém ekosystému představuje výzvu pro podniky i dodavatele,“ řekl Jagadish. „Jak nevyhnutelně nastanou problémy, Acryl zvyšuje produktivitu datových týmů. Firemní uživatelé mají centrální zdroj pro kladení a řešení otázek, spíše než ad hoc procesy pro každý problém, zatímco datoví profesionálové mohou využívat funkce Acryl pro analýzu linií a dopadů, aby výrazně zkrátili čas potřebný k vyřešení problémů s daty.