More Data Science Cheatsheets - Plato AiStream V2.1

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Kısa süre önce, size bir süredir veri bilimi hile sayfaları getirmediğimizi fark ettik. Ve bu onların müsait olmamalarından dolayı değil; Algoritmalardan istatistiklere, röportaj ipuçlarına ve ötesine kadar konuları kapsayan giriş seviyesinden ileri seviyeye kadar veri bilimi hile sayfaları her yerdedir.

Ama iyi bir hile sayfası yapan nedir? Bir hile sayfasını özellikle iyi biri olarak seçilmeye değer kılan nedir? parmağını koymak zor tam Bir kopya kağıdını iyi yapan, ancak açıkçası temel bilgileri kısa ve öz bir şekilde aktaran - bu bilgi genel nitelikte olup olmadığına bakılmaksızın - kesinlikle iyi bir başlangıçtır. Bugün adaylarımızı dikkate değer kılan da budur. Bu nedenle, veri bilimi öğreniminizde veya incelemenizde size yardımcı olacak dört küratörlü tamamlayıcı hile sayfası için okumaya devam edin.

İlk kadar Aaron Wang'ın Veri Bilimi Hile Sayfası 2.0, istatistiksel soyutlamaların, temel makine öğrenimi algoritmalarının ve derin öğrenme konularının ve kavramlarının dört sayfalık bir derlemesi. Kapsamlı olması amaçlanmamıştır, bunun yerine görüşme hazırlığı ve sınav incelemeleri gibi durumlar ve benzer düzeyde inceleme derinliği gerektiren herhangi bir şey için hızlı bir referanstır. Yazar, temel istatistik ve lineer cebir anlayışına sahip olanların bu kaynağı en çok fayda sağlayacak şekilde bulabileceklerini, yeni başlayanların da içeriğinden faydalı bilgiler alabilmesi gerektiğini belirtiyor.

şekil
Aaron Wang'ın ekran görüntüsü Veri Bilimi Hile Sayfası 2.0

Bugün sunduğumuz bir sonraki hile sayfası, Aaron Wang'ın kaynağının dayandığı şeydir, Maverick Lin'in Veri Bilimi Hile Sayfası (Wang'ın kendisinin 2.0 olarak referansı, Lin'in “orijinal”ine doğrudan bir selamdır). Lin'in hile sayfasını Wang'ınkinden daha derinlemesine düşünebiliriz (Wang'ın daha az derinlemesine yapma kararı kasıtlı ve kullanışlı bir alternatif gibi görünse de), veri temizleme, modelleme fikri, “yapma” gibi daha temel veri bilimi kavramlarını kapsar. Hadoop, SQL ve hatta Python'un temelleri ile büyük veri”.

Açıkça bu, “başlangıç” kampında daha sıkı olanlara hitap edecek ve iştah açma ve okuyucuları veri biliminin geniş alanı ve kapsadığı birçok farklı kavram hakkında bilinçlendirme konusunda iyi bir iş çıkaracaktır. Bu, özellikle okuyucu veri biliminde yeniyse, kesinlikle başka bir sağlam kaynaktır.

şekil
Maverick Lin'in ekran görüntüsü Veri Bilimi Hile Sayfası

Zamanda daha da geriye gittiğimizde - Lin'in kopya kağıdı için ilham ararken - William Chen'in Olasılık Hile Sayfası 2.0. Chen'in hile sayfası yıllar içinde çok dikkat çekti ve övgü topladı ve bu yüzden bir noktada bununla karşılaşmış olabilirsiniz. Açıkça farklı bir odakla (adı verilmiştir), Chen'in hile sayfası, çeşitli dağılımlar, kovaryans ve dönüşümler, koşullu beklenti, Markov zincirleri, çeşitli önem formülleri ve daha fazla.

10 sayfada, burada kapsanan olasılık konularının genişliğini hayal edebilmelisiniz. Ancak bunun sizi caydırmasına izin vermeyin; Chen'in kavramları temel noktalarına kadar kaynatması ve temel şeylerden ödün vermeden sade bir İngilizce ile açıklama yeteneği dikkat çekicidir. Açıklayıcı görselleştirmeler açısından da zengindir, alan sınırlı olduğunda ve özlü olma arzusu güçlü olduğunda oldukça kullanışlıdır.

Chen'in derlemesi sadece kaliteli ve zamanınıza layık olmakla kalmaz, yeni başlayanlar veya tam bir incelemeyle ilgilenen biri olarak, bu kaynakların nasıl sunulduğuna göre ters sırayla çalışırdım - Chen'in kopya sayfasından Lin'e ve nihayet Wang'ınkine, ilerledikçe kavramların üzerine inşa etmek.

şekil
William Chen'in ekran görüntüsü Olasılık Hile Sayfası 2.0

Teknik olarak bir hile sayfası olmasa da, buraya dahil ettiğim son bir kaynak, Rishabh Anand'ın Makine Öğrenimi Isırıkları. Kendisini "yaygın Makine Öğrenimi kavramları, en iyi uygulamalar, tanımlar ve teori hakkında röportaj kılavuzu" olarak faturalandıran Anand, kullanışlılığı kesinlikle başlangıçta amaçlanan görüşme hazırlığını aşan geniş bir bilgi "ısırıkları" koleksiyonu derledi. Kapsam dahilindeki konular şunları içerir:

Model Puanlama Metrikleri
Parametre Paylaşımı
k-Katlama Çapraz Doğrulama
Python Veri Türleri
Model Performansını Geliştirme
Bilgisayarla Görme Modelleri
Dikkat ve Varyantları
Sınıf Dengesizliğinin Ele Alınması
Bilgisayarla Görme Sözlüğü
Vanilya Geri Yayılımı
Düzenlileştirme
Referanslar

şekil
Ekran görüntüsü Makine Öğrenimi Isırıkları

Kaynağın kendi açıklamasında vaat edildiği gibi, makine öğrenimi "kavramları, en iyi uygulamaları, tanımları ve teorisi"ne değinilse de, bu "ısırıklar" kesinlikle uygulamaya yöneliktir ve bu da siteyi, burada kapsanan materyalin çoğunu tamamlayıcı hale getirir. daha önce bahsedilen üç hile sayfası. Bu yazıdaki kaynakların dördünde yer alan tüm materyalleri ele almak isteseydim, kesinlikle diğer üçünden sonra buna bakardım.

Böylece, öğrenmeniz veya gözden geçirmeniz için kullanmak üzere dört kopya sayfanız (veya üç kopya kağıdı ve bir kopya kağıdına bitişik kaynak) var. Umarım burada sizin için yararlı bir şey vardır ve herkesi aşağıdaki yorumlarda faydalı buldukları hile sayfalarını paylaşmaya davet ediyorum.