Książka Analityk danych ukazuje się w odpowiednim czasie, zważywszy na aktualny stan danych i analityki w organizacjach. Przyjrzyjmy się szybko najnowszej historii. Kilka czołowych firm skutecznie wykorzystywało dane oraz analizy do podejmowania decyzji i działań przez kilka dziesięcioleci, począwszy od lat 70. XX wieku. Jednak większość zignorowała ten cenny zasób lub ukryła go na zapleczu, gdzie był mało widoczny i nie odgrywał istotniejszej roli.

Od początku do połowy lat dwutysięcznych sytuacja powoli się zmieniała, a dyrektorzy zaczęli ekscytować się potencjalnym wpływem danych i analiz na wyniki biznesowe ich przedsiębiorstw. W drugiej dekadzie XX wieku zainteresowanie zaczęło przesuwać się w kierunku „big data” — dużych zbiorów danych, które pierwotnie pochodziły od firm internetowych, ale stopniowo zaczęły pojawiać się w wielu obszarach zaawansowanych gospodarek. Aby poradzić sobie ze zwiększoną ilością i złożonością danych, firmy zaczęły tworzyć stanowiska „specjalisty data science” — najpierw w Dolinie Krzemowej, a później wszędzie.

 

Jednak gdy firmy zaczęły adaptować się do modelu big data, nacisk ponownie przesunął się — w wielu firmach w okresie około 2015 – 2018 roku — na sztuczną inteligencję. Zbieranie, przechowywanie i analizowanie dużych zbiorów danych ustąpiło miejsca uczeniu maszynowemu, przetwarzaniu języka naturalnego i automatyzacji.

 

Z tymi szybkimi zmianami wiąże się szereg założeń dotyczących danych i analityki. Miło mi tu stwierdzić, że książka Analityk danych podważa wiele z nich — i najwyższy czas. Jak zaczyna przyznawać wiele osób, które uważnie obserwują powyższe trendy, założenia te prowadzą nas w pewnych bezproduktywnych kierunkach. Opiszę zatem pięć powiązanych ze sobą założeń i wyjaśnię, dlaczego idee zawarte w tej książce są z nimi sprzeczne.

 

Założenie 1. Analityka, big data i AI to zupełnie różne zjawiska.

 

Wielu obserwatorów zakłada, że „tradycyjna” analityka, big data i sztuczna inteligencja to odrębne i różne zjawiska. Jednak książka Analityk danych słusznie przyjmuje, że są one ze sobą mocno powiązane. Wszystkie wymagają myślenia statystycznego. We wszystkich trzech przypadkach stosuje się tradycyjne podejścia analityczne, takie jak analiza regresyjna, podobnie jak techniki wizualizacji danych. Analityka predykcyjna to w zasadzie to samo, co nadzorowane uczenie maszynowe. A większość technik analizy danych działa na zbiorach danych o dowolnym rozmiarze. Krótko mówiąc, dobry spec od danych może skutecznie pracować we wszystkich trzech dziedzinach, a nadmierne skupianie się na różnicach między nimi nie jest zbyt produktywne.

 

Założenie 2. Specjaliści data science to jedyni ludzie, którzy mogą bawić się w tej piaskownicy.

 

Darzymy specjalistów data science dużym respektem i często zakładamy, że są jedynymi osobami, które mogą efektywnie pracować z danymi i analityką. Istnieje jednak rodzący się, ale ważny ruch w kierunku demokratyzacji tych idei; coraz więcej organizacji stawia na „obywatelskich specjalistów od danych”. Zautomatyzowane narzędzia do uczenia maszynowego ułatwiają tworzenie modeli, które doskonale sprawdzają się w przewidywaniu. Oczywiście profesjonalni naukowcy zajmujący się danymi nadal są potrzebni do opracowywania nowych algorytmów i sprawdzania złożonych analiz wykonywanych przez laików. Jednak organizacje, które demokratyzują analitykę i data science — korzystając z pracy „amatorskich” speców od danych — mogą znacznie zwiększyć ogólne wykorzystanie tych ważnych możliwości.

 

Założenie 3. Specjaliści data science to „jednorożce” dysponujące wszystkimi wymaganymi umiejętnościami.

 

Zakładamy, że specjaliści data science — wyszkoleni w opracowywaniu i kodowaniu modeli — umieją również wykonywać wszystkie inne czynności wymagane do pełnej implementacji tych modeli. Innymi słowy, wydaje nam się, że są „jednorożcami” i potrafią wszystko. Ale takie jednorożce nie istnieją, a jeśli już, to jest ich niewiele. Spece od danych, którzy nie tylko rozumieją podstawy data science, ale znają się na biznesie, potrafią efektywnie zarządzać projektami i umieją budować relacje biznesowe, są niezwykle wartościowymi uczestnikami projektów data science. Mogą być produktywnymi członkami zespołów data science i zwiększać prawdopodobieństwo, że realizowane projekty przełożą się na wartość biznesową.

 

Założenie 4. Potrzeba naprawdę wysokiego IQ i długiej nauki, żeby odnieść sukces w analityce danych.

 

Powiązanym założeniem jest to, że aby zajmować się danymi, trzeba być bardzo dobrze wyszkolonym w tej dziedzinie i świetnie radzić sobie z matematyką. Zarówno nauka, jak i predyspozycje z pewnością pomagają, ale książka Analityk danych dowodzi — a ja się z tym zgadzam — że zmotywowany uczeń może opanować analitykę w wystarczającym stopniu, aby być całkiem użytecznym w projektach data science. Wynika to po części z tego, że ogólne zasady analizy statystycznej wcale nie są aż tak skomplikowane, a po części z tego, że „bycie użytecznym” w projektach data science nie wymaga wyjątkowej biegłości w zakresie analityki i przetwarzania danych. Praca z profesjonalnymi analitykami danych lub automatycznymi programami AI wymaga jedynie umiejętności zadawania dobrych pytań, łączenia kwestii biznesowych z wynikami obliczeń oraz zwracania uwagi na wątpliwe założenia.

 

Założenie 5. Jeśli nie studiowałeś(-łaś) głównie przedmiotów matematycznych, jest już za późno, aby nauczyć się tego, czego potrzeba do pracy z danymi i analityką.

 

o założenie jest poparte danymi sondażowymi; w raporcie z ankiety przeprowadzonej w 2019 roku przez firmę Splunk wśród około 1300 dyrektorów na całym świecie praktycznie każdy respondent (98%) zgodził się, że umiejętności związane z danymi będą ważne na przyszłych stanowiskach pracy. 81% podaje, że umiejętności związane z danymi są wymagane do objęcia wyższych stanowisk kierowniczych, a 85% — że w przyszłości będą one bardziej cenione w ich firmach. Niemniej jednak 67% twierdzi, że nie czuje się komfortowo, uzyskując dostęp do danych lub korzystając z nich, 73% uważa, że trudniej opanować umiejętności związane z danymi niż inne umiejętności biznesowe, a 53% sądzi, że są za starzy, aby się ich nauczyć. Taka defetystyczna postawa szkodzi jednostkom i organizacjom, a ani autorzy tej książki, ani ja nie uważamy, że jest uzasadniona. Przejrzyj strony następujące po tej przedmowie, a zobaczysz, że diabeł nie jest tak straszny, jak go malują!

 

Zapomnij więc o fałszywych założeniach i zmień się w speca od danych. Staniesz się cenniejszym pracownikiem i poprowadzisz swoją organizację do większych sukcesów. Właśnie w tę stronę zmierza świat, więc czas wziąć się do roboty i nauczyć się więcej o danych i analityce. Myślę, że ten proces — i lektura książki Analityk danych — okaże się bardziej satysfakcjonujący i przyjemny, niż mógłbyś (mogłabyś) przypuszczać.

 

Thomas H. Davenport
Profesor w Babson College
Profesor wizytujący w Oxford Saïd Business School
Pracownik naukowy, MIT Initiative on the Digital Economy
Autor książek Competing on Analytics, Big Data @ Work
oraz The AI Advantage

 

Fragment pochodzi z Przedmowy do książki: Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym, Alex J. Gutman, Jordan Goldmeier, Helion 2023