1. Anasayfa
  2. Veri Bilimi

Bulutta Veri Bilimi

Veri Bilimi için Süslü Bir PC'ye İhtiyacınız Yok: Bu Bulut Platformlarını Kullanın!

Bulutta Veri Bilimi
Bulutta Veri Bilimi
0

Bulutta Veri Bilimi – Veri bilimi ve makine öğrenimine başlamak için şık bir bilgisayara ihtiyacınız yok. Aslında, tüm kodunuzu bulut tabanlı not defterlerinde yerel olarak bir ortam kurma konusunda endişelenmenize gerek kalmadan çalıştırabilirsiniz.

Veri biliminde yeni olsanız bile, muhtemelen Jupyter Notebook terimini duymuşsunuzdur. Veri bilimi yapmanın 1 numaralı yolu haline geldi. Jupyter Notebook kodunuzu çalıştırmayı, yorum yazmayı ve çıktılarınızı tek bir yerde görmeyi çok daha kolay hale getirir. Hemen hemen tüm bulut platformları, bir tür Jüpiter benzeri ortam kullanır.

Veri Bilimi Mülakat Rehberi

Bulutta Veri Bilimi

Bu blog yazısında, bulutta veri bilimi yapmanın 5 yolunu paylaşacağım. Bu platformların her biri, bunu tamamen ücretsiz olarak yapmanızı sağlar ve her biri gerçekten iyi çalışır.

Bence, veri bilimi için bulut platformlarını kullanmanın en büyük 2 avantajı:

Kurulum hızı – Sadece birkaç dakika içinde kurulum yapabilir ve makine öğrenimi yapmak için ihtiyacınız olan hemen hemen her şeye sahip olabilirsiniz. Kod yazmaya ve verileri analiz etmeye başlamadan önce yerel olarak bir ortam kurma zahmetinden geçmeniz gerekmez.

İşbirliği – Çalışmanızı paylaşabilmek ve projeler üzerinde işbirliği yapabilmek, her türlü bulut platformunun büyük bir avantajıdır. Ancak, burada listelenen tüm platformlar için işbirliği mevcut değildir. Teklif edildiğinde bile, işbirliğinin derecesi platformdan platforma farklılık gösterir.

Bu yazıda 5 platform ele alınacaktır:

  • Datacamp Workspaces
  • Kaggle Notebooks
  • Google Colab
  • Deepnote
  • Datalore by JetBrains
  • Gradient Notebooks

Bu platformları nasıl değerlendirdiğime dair dikkat etmeniz gereken birkaç şey var. Aslında bu platformların her birini kendim denedim ve onlar hakkında ne düşündüğüm konusunda kendi görüşlerimi veriyorum. Bulut platformlarını birincil kullanımım, şirket veya kurumsal kullanım için değil, kişisel projeler üzerinde çalışmaktır.

Bu platformları karşılaştırmak için kullandığım kriterler şunlardır:

Fiyat – ücretsiz olmalı veya en azından iyi bir ücretsiz plan sunmalıdır (sadece bir deneme değil)

Kurulum hızı – ‘İzin verilen saatleri’ aşmam durumunda projelerime ‘bakmak’ zorunda kalmamalıyım. Sunucuyu kapatıp kapatmayacağımı düşünmeden oturum açabilmek, bir proje üzerinde çalışabilmek ve oturumu kapatabilmek istiyorum.

Estetik ve sezgisel – uygulama iyi görünmeli, sezgisel ve kullanımı kolay olmalıdır

İşbirliği – Çalışmalarımı arkadaşlarımla paylaşabilmek ve onlar üzerinde canlı olarak işbirliği yapabilmek istiyorum. Ayrıca, istersem projem herkese açık olmadan güvenli bir şekilde paylaşma seçeneğine de sahip olmak istiyorum.

Harika, şimdi hepsini temizledim, hadi başlayalım.

Datacamp Workspaces

DataCamp, Jüpyter benzeri bir ortamda kod çalıştırmanıza olanak tanıyan Çalışma Alanları özelliğini kısa süre önce kullanıma sundu. Şu anda ortak çalışma özelliği yoktur ancak bu, üzerinde çalıştıkları bir şey olması muhtemel. Şu anda, not defterlerinizi başkalarıyla paylaşabilirsiniz ve onlar da onları görebilir ve yorum ekleyebilir.

Workspaces‘in ilk lansmanında DataCamp‘ın felsefesi, veri bilimi yapmanın öğrenmesi kadar kolay olmasını istemeleridir. Veri bilimini öğrenmek için zaten inanılmaz bir etkileşimli ortam yarattılar ve Çalışma Alanları artık becerilerini kolayca uygulamak ve bir portföy oluşturmaya başlamak isteyen herkes için doğal bir sonraki adım gibi görünüyor.

Çalışma Alanları tamamen ücretsizdir ve R veya Python arasında seçim yapabilirsiniz. Şimdiye kadar, defter düzenleyicileri iyi görünüyor ve kullanımı sezgisel. Ayrıca, çalışma alanını sorunsuz hale getiren, çalıştırmaya veya sürdürmeye dahil olan hiçbir yönetici yoktur.

Kaggle

Bana göre Kaggle, 2010’da başlayan bulut tabanlı veri bilimi platformlarının OG’si gibidir. Başlangıçta, bir makine öğrenimi rekabet platformu olarak başladılar. O zamandan beri genişlediler ve şimdi veri kümelerini, not defterlerini paylaşmanın yollarını sunuyorlar ve forumlarında soru sorabileceğiniz ve yardım alabileceğiniz büyük bir topluluğa sahipler.

Kaggle dizüstü bilgisayarlar, R ve Python arasında seçim yapma seçeneğiyle birlikte ücretsizdir ve diğer hizmetlerle iyi bir şekilde bütünleşirler. Hatta ihtiyacınız olduğunda donanımı güçlendirmek için Kaggle dizüstü bilgisayarınızı Google Bulut Hizmetlerine bağlayabilirsiniz, ancak bu elbette ek bir ücrete tabi olacaktır. Kaggle, bir GPU’ya erişim sağlar ve kişisel projeler için genellikle fazlasıyla yeterlidir.

Kaggle not defterlerinde işbirliği sınırlıdır. DataCamp‘a benzer şekilde, not defterlerinizi diğer kişilerle (bir yarışmadaki takım arkadaşlarınız gibi) paylaşabilirsiniz, ancak not defterinin farklı sürümleri üzerinde etkili bir şekilde çalışırsınız, bu nedenle canlı işbirliği özelliği yoktur.

Google Colab

Google Colab, tıpkı Google Dokümanlar veya E-Tablolar gibi Google Drive’ın doğal bir uzantısı olarak çalışan Google ürünlerinden biridir. Bu diğer ürünleri zaten kullanıyorsanız, Colab kullanıcı arayüzü size çok tanıdık gelecektir.

Doğal olarak, Colab not defterlerinde paylaşım yerleşiktir. Ancak, canlı işbirliği yapma yeteneğine sahip görünmüyor (yani, bir not defterini gerçek zamanlı olarak birlikte düzenleyen 2 veya daha fazla kişiyle). Google temelde Doc ile gerçek zamanlı işbirliği üzerine bir hizmet sunduğu için bunu hayal kırıklığı olarak görüyorum.

Colab ayrıca özellikle güzel bir uygulama değil, özellikle bu listede ele alacağım diğer platformlardan bazıları ile karşılaştırıldığında. Ancak, veri bilimi ile ilgilenen hemen hemen herkesin en az 1 google hesabı olduğundan, kurulum açık ara en hızlısıdır.

Colab‘ı kullanmak ücretsizdir ancak kaynak garanti edilmez ve talebe bağlı olarak değişen çeşitli kullanım limitleri vardır. Kodunuz daha fazla kaynak kullanıyorsa, kullanım sınırlarınız farklı olabilir.

Deepnote

Deepnote, şimdiye kadar karşılaştığım en iyi görünümlü, tam özellikli platform. Kullanıcı arayüzü harika görünüyor, not defterleriyle düzenleme deneyimi harika ve canlı işbirliğine sahipler! Tüm bunlar ve kullanımı hala ücretsizdir (bir noktaya kadar) ayrıca platform hala Beta’dadır, bu nedenle gelecek çok şey olduğunu söyleyebiliriz.

Özellikle yayınlama özelliklerini seveceksiniz – not defterinizi bir makale veya etkileşimli bir uygulama veya gösterge panosu olarak yayınlayabilirsiniz. Sadece makalelerin ve gösterge tablolarının sunumunu seviyorum. Deepnote‘taki profiliniz aynı zamanda bir portföy görevi görür ve çalışmanıza bakan herkes için harika bir görüntüleme deneyimidir.

Standart makinelerinde 750 saate kadar zaman ayırabilirsiniz ve her dizüstü bilgisayar, 15 dakika işlem yapılmadığında makineyi otomatik olarak kapatan şık küçük bir özellikle birlikte gelir.

Datalore

Datalore, JetBrains ekibi tarafından oluşturulmuş bir platformdur. Kullanıcı arayüzü iyi görünüyor ve ayrıca canlı işbirliği ile birlikte geliyor. Bu platformla programlama dilleri açısından da birkaç seçenek daha var – Python, R, Kotlin ve Scala arasından seçim yapabilirsiniz.

Bu platformla ilgili biraz yönetici bilgisine ihtiyaç var. Ücretsiz planda, 120 saat/ay temel makine süresi elde edersiniz. Ancak, bir kez bir not defterini açtığınızda, tarayıcınızda açık bir sekme olduğu sürece, kaynakları tüketecek ve uygun saatlerinizi tüketecektir. Bu nedenle, sekmeyi kapatmak veya makineyi manuel olarak kapatmak önemlidir.

Ayrıca, not defterlerinizden birini biriyle paylaştıysanız ve günün sonunda o kişi tarayıcı penceresini kapatmayı unutursa, mevcut kotanızı tüketir. Bu akılda tutulması gereken önemli bir şey.

Gradient Notebook

Gradient Notebook‘lar Paperspace tarafından oluşturulmuş. Gradient‘in en büyük satış noktası, ücretsiz GPU’lar sunmalarıdır. Ücretsiz plan için, Platformdaki saat sayısını sınırlamak yerine, koydukları tek sınırlama, aynı anda yalnızca 1 dizüstü bilgisayar çalıştırabilmeniz ve tüm not defterlerinin herkese açık olması gerektiğidir.

Platformda kurulum yapmak ve bir dizüstü bilgisayarı başlatmak, sundukları tüm bu ek donanımların sağlanması gerektiğinden birkaç dakika sürebilir. Not defterlerini yayınlamak ve platformlarını kullanarak bir proje portföyü oluşturmak için de sınırlı işlevsellik vardır. Şu anda herkese açık bir profil özelliği üzerinde çalışıyorlar, yani en azından yol haritasında.

Gradient, projeniz için daha fazla kaynağa ve daha fazla işleme ihtiyacınız varsa ve bunu elde etmek için Google Cloud veya AWS gibi bir bulut sağlayıcısına ödeme yapmak istemiyorsanız gidilecek platformdur.

Bulutta Veri Bilimi Sonuç Bağlamı

Hangi bulut platformunun kullanılacağını seçmek, kendi hedeflerinize ve ihtiyaçlarınıza bağlıdır.

Veri bilimi becerilerinizi öğrenirken ve geliştirirken bir portföy oluşturmak ve büyük bir topluluğa dahil olmak için bir yer arıyorsanız Kaggle veya DataCamp‘ı öneririm.

Tüm özelliklere sahip, profesyonel görünümlü bir portföy oluşturmanıza olanak tanıyan ve gerçek zamanlı işbirliği sunan bir platform arıyorsanız Deepnote‘u öneririm.

Derin öğrenme, NLP ve bilgisayar vizyonu dallarına ayrılmaya başladıysanız, Gradient‘i denemenizi tavsiye ederim.

Neredeyse tüm mevcut veri bilimi not defteri platformlarının kapsamlı bir listesi için bu kaynağa bakın.

Dünyanın EN SEKSİ mesleği ya da Masterchef!

Tebrikler,  bu yazının sonuna geldiniz! Umarım kariyerinizde size yardımcı olacak yeni bir şey öğrenmişsinizdir.

Yeni bir şey öğrendiyseniz veya bu makaleyi okumaktan zevk aldıysanız, başkalarının görebilmesi için lütfen paylaşın. O zamana kadar, bir sonraki yazıda görüşmek üzere! Ayrıca beni Twitter’da @hasanyildiz84 hesabımdan takip edebilirsiniz.

Hasan YILDIZ, Girişimci. Doktora Öğrencisi. Yazmayan YAZILIMCI. Veri Şeysi. Eğitmen...

Yazarın Profili

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir