Inne bazy danych
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
- Szczegóły
- Kategoria: Inne bazy danych
Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje się ważne również dla programistów R i Pythona, którzy tworzą rozwiązania dla data science. Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki.
To drugie wydanie popularnego podręcznika statystyki przeznaczonego dla analityków danych. Uzupełniono je o obszerne przykłady w Pythonie oraz wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają istotną rolę w data science.
Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.
W książce między innymi:
- analiza eksploracyjna we wstępnym badaniu danych,
- próby losowe a jakość dużych zbiorów danych,
- podstawy planowania eksperymentów,
- regresja w szacowaniu wyników i wykrywaniu anomalii,
- statystyczne uczenie maszynowe,
- uczenie nienadzorowane a znaczenie danych niesklasyfikowanych.
Statystyka: klasyczne narzędzia w najnowszych technologiach!
Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców.
Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż.
Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki.
- Zarządzanie danymi w zbiorach o dużej skali. Nowoczesna architektura z siatką danych i technologią Data Fabric. Wydanie II - [21 maj 2024]
- Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II - [17 styczeń 2024]
- Microsoft Power BI dla zaawansowanych. Eksperckie techniki tworzenia interaktywnych analiz w świecie biznesu. Wydanie II - [03 październik 2023]
- Microsoft Power BI. Jak modelować i wizualizować dane oraz budować narracje cyfrowe. Wydanie III - [25 sierpień 2023]
- Poznaj Tableau 2022. Wizualizacja danych, interaktywna analiza danych i umiejętność data storytellingu. Wydanie V - [12 lipiec 2023]