Більше шпаргалок Data Science

Перевидано Платоном

читають: 0

Нещодавно ми зрозуміли, що давно не надавали вам жодних шпаргалок із науки про дані. І справа не в їх відсутності; Шпаргалки з науки про дані є скрізь, починаючи від вступних і закінчуючи складними, охоплюючи теми від алгоритмів до статистики, порад для співбесід тощо.

Але що робить шпаргалку гарною? Що робить шпаргалку гідною того, щоб її виділили як особливо хорошу? Важко вказати пальцем точно що робить хорошу шпаргалку, але, очевидно, таку, яка стисло передає важливу інформацію (незалежно від того, чи ця інформація конкретного або загального характеру), безперечно, є хорошим початком. І це те, що робить наших сьогоднішніх кандидатів вартими уваги. Тож читайте чотири підібрані додаткові шпаргалки, які допоможуть вам у вивченні чи перегляді наукових даних.

Перше - це Data Science Cheatsheet 2.0 Аарона Ванга, чотиристорінкова компіляція статистичних абстракцій, фундаментальних алгоритмів машинного навчання та тем і концепцій глибокого навчання. Він не має на меті бути вичерпним, а натомість є короткою довідкою для таких ситуацій, як підготовка до співбесіди та огляди іспитів, а також будь-що інше, що потребує подібного рівня глибини огляду. Автор зазначає, що хоча для тих, хто має базове розуміння статистики та лінійної алгебри, цей ресурс буде найбільш корисним, початківці також повинні мати можливість отримати корисну інформацію з його вмісту.

Рисунок
Скріншот з Aaron Wang Data Science Cheatsheet 2.0

Наша наступна сьогоднішня шпаргалка – це та, на якій базується ресурс Аарона Ванга, Шпаргалка Maverick Lin's Data Science (Посилання Вана на його власний як на 2.0 є прямим киванням на «оригінал» Ліна). Ми можемо вважати шпаргалку Ліна більш глибокою, ніж Ван (хоча рішення Вана зробити її менш глибокою здається навмисним і корисною альтернативою), охоплюючи більш фундаментальні концепції науки про дані, такі як очищення даних, ідея моделювання, виконання « великі дані» з Hadoop, SQL і навіть основами Python.

Зрозуміло, що це сподобається тим, хто більш твердо стоїть на таборі «початківців» і добре справляється з розпалюванням апетиту та ознайомленням читачів із широким полем науки про дані та багатьма різними концепціями, які вона охоплює. Це, безперечно, ще один надійний ресурс, особливо якщо читач новачок у науці про дані.

Рисунок
Скріншот із Maverick Lin's Data Science Cheatsheet

Коли ми рухаємося далі в часі — шукаючи натхнення для шпаргалок Лін — ми стикаємося Шпаргалка щодо ймовірностей Вільяма Чена 2.0. Шпаргалка Чена за ці роки привернула багато уваги та похвали, тому ви, можливо, колись натрапили на неї. Зрозуміло, що з іншою спрямованістю (враховуючи її назву), шпаргалка Чена є прискореним курсом або глибоким оглядом концепцій ймовірностей, включаючи різні розподіли, коваріацію та перетворення, умовне очікування, ланцюги Маркова, різні формули важливості та набагато більше.

На 10 сторінках ви зможете уявити собі широту ймовірних тем, які тут розглядаються. Але нехай це вас не заважає; Заслуговує на увагу здатність Ченя зводити концепції до їх суттєвих пунктів і пояснювати простою англійською мовою, не жертвуючи основними. Він також багатий пояснювальними візуалізаціями, що дуже корисно, коли простір обмежений, а бажання бути лаконічним є сильним.

Компіляція Чена не тільки якісна і варта вашого часу, як новачок або хтось, хто зацікавлений у повному огляді, я б працював у зворотному порядку, як ці ресурси були представлені — від шпаргалки Чена до Ліна і, нарешті, до Ванга, на основі концепцій.

Рисунок
Скріншот з Вільяма Чена Шпаргалка ймовірностей 2.0

Останній ресурс, який я тут включив, хоча технічно це не шпаргалка, це Укуси машинного навчання Рішабха Ананда. Називаючи себе «посібником для інтерв’ю щодо поширених концепцій машинного навчання, найкращих практик, визначень і теорії», Ананд зібрав широку колекцію «уривків» знань, корисність яких виходить за рамки початково запланованої підготовки до співбесіди. Теми, які охоплюються, включають:

Показники оцінювання моделі
Спільне використання параметрів
K-кратна перехресна перевірка
Типи даних Python
Покращення продуктивності моделі
Моделі комп’ютерного зору
Увага та її різновиди
Подолання дисбалансу класів
Комп’ютерний зір Глосарій
Ванільне зворотне поширення
Регуляризація
посилання

Рисунок
Знімок екрана з Укуси машинного навчання

У той час як «концепції, найкращі практики, визначення та теорія» машинного навчання торкаються, як і обіцяно в описі самого ресурсу, ці «уривки» безперечно орієнтовані на практичне, що робить сайт доповненням до більшості матеріалів, розглянутих у три вищезгадані шпаргалки. Якби я хотів охопити весь матеріал усіх чотирьох ресурсів у цьому дописі, я б, звичайно, подивився на це після інших трьох.

Отже, у вас є чотири шпаргалки (або три шпаргалки та один прилеглий до шпаргалок ресурс), які можна використовувати для навчання чи повторення. Сподіваюся, тут щось стане в нагоді для вас, і я запрошую всіх поділитися шпаргалками, які вони знайшли корисними, у коментарях нижче.