Makine öğrenimi ve derin öğrenme üzerine bir eleştiri
Rassal yürüyüş nedir? Lyapunov time nedir? Ya da daha basit bir soru sorayım, deterministik sistemler ve stokastik sistemler arasındaki fark nedir?
Son zamanlarda bu sorulara yanıt veremeyecek olan kişilerin her probleme makine öğrenimi ve derin öğrenme yöntemlerini uyguladığını görüyorum. Üslubum sert olacak, çünkü kendine veri bilimci ya da veri bilimi uzmanı diyip istatistiğin gereksiz olduğunu, istatistiğe gerek olmadığını söyleyen kişilerin sayısı çoğalmaya başladı. Bir jupyter-notebook üzerinde herhangi bir baseline algoritma belirlemeden, sadece scikit-learn kodlarını çalıştırıp confusion-matrix’e bile bakmadan model performansının %99 olduğunu (çünkü imbalanced class problemi var veride) söyleyen kişiler çoğaldı.
En sık karşılaştığım yazılardan bahsedeceğim. Yazılar çeşitli verilerin LSTM modelleriyle tahminlerini içeriyor.
- Hisse / kriptopara fiyatlarının LSTM ile tahmini: Fiyatı tahmin etmiş diyelim, bu tahmin ile herhangi bir strateji yazılmış mı? Bu stratejinin backtesting’i yapılmış mı? (Backtesting’in başka problemleri de var ancak ona değinmeyeceğim.)
Basit düşünün, bir kişi bir algoritma ile para kazanıyorsa o algoritmayı niye sizinle paylaşsın?
2. LSTM ile deprem/hava durumu vb. gibi çeşitli fiziksel olayların tahmini: Fiziksel olayların arkasında yatan mekanikleri görmezden gelip doğrudan LSTM ile zaman serisi tahmini ne kadar mantıklı?
Bu yazı sadece eleştiri yazısı oldu ancak yazıda bahsettiğim terimleri açıklamamı isterseniz daha detaylı bir yazı hazırlarım gelecekte.
Ayrıca bu yazıya tepki olarak beni eleştiren yorumlarda olacaktır ancak demek istediğim şeyleri anlayanlar zaten bana hak verecektir.
Görüşmek üzere.