Kuantum perspektifli AI değerlendirmesi: Kar beklentisi herkes için 1'den küçük, yapay zeka trader'ların yerini almaya ne kadar uzak?

PANews

2025-11-24 06:43:22

Yazar: Frank, PANews

Eğer sana 10000 dolar verilse, hangi yapay zekaya güvenip işlemlerini onun yapmasını istersin?

Daha önce, PANews, nof1.ai'nin AI ticaret yarışması hakkında bir değerlendirme yapmıştı (İlgili okuma: Altı büyük AI “trader” on günlük mücadele: Trend, disiplin ve açgözlülük üzerine bir açık ders). Ancak, nof1.ai'nin yarışmasının süresi belirli bir piyasa dönemine dayanıyordu ve çeşitli AI büyük modellerinin nihai ticaret yetenekleri belirli bir ticaret döneminde tam olarak sergilenemiyor gibi görünüyor. Ayrıca, insanların AI modellerinin farklı koşullar altında gerçek tahmin yetenekleri hakkında bir yanıt arayışında olduğu da bir gerçek. Son olarak, son günlerde çeşitli AI şirketleri en yeni büyük modellerini tanıttı ve modellerin yetenek sıralaması yeniden sıralama aşamasında.

Bu bulmacayı çözmek için PANews, bir “AI Trader Şampiyonası” düzenledi. Farklı senaryolar altında, AI büyük modellerinin piyasa değerlendirme yetenekleri ve ticaret planlama yeteneklerini anlamak. Örneğin, hangi zaman diliminde piyasa analizinde daha yetenekli oldukları ve göstergelerin yardımcı koşul olarak kullanıldığında, AI'nın tahmin başarı oranının artıp artmayacağı.

Zaman dilimini 2017'den bugüne uzattık, Binance BTC tarih verilerinden rastgele 100 gerçek piyasa dilimi seçtik ve “4 saatlik çıplak K”, “15 dakikalık kısa vadeli”, “4 saatlik tam göstergeler” olmak üzere üç büyük cehennem seviyesi test senaryosu oluşturduk. Altı katılımcı, günümüz ABD ve Çin'in hesaplama gücünün zirvesi: Gemini-3-pro, Doubao-1.6-vision, DeepSeek V3.2, Grok 4.1, GPT-5.1, Qwen3-max.

Bu test, Binance BTC spot işlem çiftinin 2017 yılının Ağustos ayından günümüze kadar olan 15 dakikalık K-line verilerini ve 2021 yılından itibaren 4 saatlik K-line verilerini topladı. Her döngüde, 100 K-line'lık zaman dilimine sahip 50 rastgele görüntü üretildi. 4 saatlik döngü iki türde oluşturuldu; birincisi yalnızca K-line ve işlem hacmi içeren görüntüler, diğeri ise EMA, SMA, Bollinger Bantları, MACD, RSI gibi göstergelerin bilgilerini içeren K-line grafikleri. 15 dakikalık K-line grafikleri tamamen çıplak K-grafikleri (işlem hacmi ile birlikte). Ayrıca, AI'ya mevcut K-line grafiğinin karşılık geldiği spesifik fiyat verisi veya gösterge veri değerleri senkronize edildi. Tüm AI çıktıları burada görüntülenebilir.

4 saatlik gösterge grafiği

4 saatlik saf K çizgisi diyagramı

Test sürecinde, her büyük modelin elde ettiği veri bilgileri ve komutlar tamamen aynıdır. Başka bir açıdan bakıldığında, bu durum bu büyük modellerin çok modlu yeteneklerini de sınamaktadır (DeepSeek sadece metin büyük modeline sahip olduğu için, nihayetinde alınanlar yalnızca veri bilgileri olup, resim iletilmemiştir).

Gemini 3: “Göstergeler” ile mühürlenmiş çıplak K'nın kralı

Gemini 3, 11 Kasım 18'deki medya yorumları ve testlere göre, şu anda en popüler AI büyük modeli olarak kabul edilmektedir ve kapsamlı yetenekleri ile en güçlü AI çok modlu büyük modeldir. Ancak, bu ticaret tahmini testinde, Gemini 3'ün sonuçları en iyi olarak değerlendirilemez, sadece ortalama düzeydedir. Üç senaryo arasında (4 saatlik çıplak K, 4 saatlik göstergeli, 15 dakikalık çıplak K), Gemini 3'ün en iyi performansı 4 saatlik çıplak K senaryosunda ortaya çıkmıştır; kazanma oranı %39.58'dir, ardından 15 dakikalık çıplak K senaryosunda %34.04 ile gelmektedir. Göstergeli durumda (aynı zaman diliminde) 4 saatlik periyodun doğruluk oranı ise %31'e düşerek üç senaryo arasında en düşük olmuştur.

Bu açıdan bakıldığında, Gemini 3 saf mum çubukları formasyonunda daha başarılı gibi görünüyor, eklenen göstergeler ise kolayca dikkat dağıtıcı olabiliyor. Belirli bir işlem sürecinde, göstergeler olmadan Gemini 3'ün pozisyon açma konusunda daha cesur olduğu görülüyor; saf mum çubukları durumunda, piyasanın %95'i giriş yapmayı tercih ederken, göstergeler eklendikten sonra bu oran %71'e düşüyor. Ayrıca, Gemini 3'ün 4 saatlik saf mum çubukları durumunda kâr elde eden tek model olduğunu belirtmek gerekir.

15 dakikalık senaryoda, Gemini 3'ün genel kâr durumu en iyi durumda, toplam pozisyon kârı %15.34; ancak göstergeli senaryoda %21.18 kaybetti. Ancak bu kâr, aynı zamanda kısa vadeli bir şans. Her seferinde elde edilen kâr/zarar oranı verilerini birleştirdiğimizde, Gemini 3'ün kâr beklentisi (zafer oranı * kâr/zarar oranı) 1'in altında kalıyor, bu da uzun vadede kayıplı bir durum olduğunu gösteriyor.

DeepSeek V3.2: Eski köpek gibi sağlam “ultra kısa vadeli ticaret makinesi”

DeepSeek, altı model arasında kazanma oranı açısından en iyi performansa sahip modeldir ve aynı zamanda en stabil olanıdır. Üç senaryoda (4 saat çıplak K, 4 saat göstergeli, 15 dakika çıplak K) kazanma oranları sırasıyla %40, %41.38, %42.86'dır. Bu açıdan bakıldığında, DeepSeek'in tahmin yeteneği farklı zaman dilimlerinde ve göstergelerin varlığında nispeten stabil kalmaktadır.

Ancak, DeepSeek'in nihai kâr durumu kötüydü, çünkü kâr-zarar oranı çok düşüktü, ortalaması sadece 1.25. Bu tür bir kâr-zarar oranı, DeepSeek'in işlem sürecinde kârları artırma yeteneğinden yoksun olduğunu da göstermektedir. Bu nedenle, kâr beklentisi neredeyse 0.5 civarında olup, uzun vadede de kâr olasılığı düşüktür. Ayrıca, DeepSeek'in pozisyon açma kararında da nispeten temkinli olduğu, genel pozisyon açma oranının sadece %58 olduğu görülmektedir.

Doubao (豆包): Bu yarışmanın "Tüm Yıldız MVP"si

Bu test yarışmasında, Doubao1.6-vision'un toplam sonuçları en iyi oldu. 4 saatlik gösterge senaryosunda, Doubao1.6-vision'un kazanma oranı testteki en yüksek veriye ulaştı ve %50'ye ulaştı, nihai kazanç %22,2 oldu. Aynı zamanda 15 dakikalık kısa dönemde, genel olarak %8,2'lik bir kazanç seviyesine ulaştı. Farklı iki boyutta (kısa vadeli ve 4 saatlik gösterge) istikrarlı bir şekilde kazanan tek modeldir.

Ve Doubao1.6-vision'un bu sonucu, nispeten temkinli bir tarzda değil, ortalama pozisyon açma oranı %92'den fazla bir seviyede elde edilmiştir. Yani, Doubao1.6-vision, çoğu durumda pozisyon açmayı tercih etmiştir. Ancak, karşılaştırıldığında, Doubao1.6-vision'un yetenekleri de gösterge sinyallerine oldukça bağımlıdır; gösterge olmadan toplam kâr %38 farklılık göstermektedir. Ayrıca, kâr-zarar oranı verilerine göre, Doubao1.6-vision'un pozitif getiri elde ettiği iki dönem içindeki zarara uğrama oranı oldukça yüksektir, bu da onun genel olarak başarılı olmasının bir sebebidir.

Grok 4.1: xAI'den “Radikal Bahisçi”

Grok 4.1'in genel tarzı cesur ama çeyrek bağımlı göstergelere dayanırken, daha büyük kâr peşinde koşmaya istekli. Üç senaryo içinde, yalnızca gösterge ile 4 saatlik dilimde Grok 4.1 %34.69'luk bir kazanma oranı elde etti, diğer iki senaryodaki kazanma oranı ise oldukça düşük. 4 saatlik saf mum çubukları durumunda, kazanma oranı yalnızca %14.58, 15 dakikalık dilimde ise %26.53. Ancak açtığı pozisyonların ortalama oranı %98'e kadar çıkıyor, neredeyse tüm mum çubuğu senaryolarında pozisyon açmaya istekli. Bu açıdan bakıldığında, Grok 4.1'in tarzı daha çok kontrolsüz bir kumarbaz gibi.

Ancak, Grok 4.1'in kâr-zarar oranı genellikle oldukça yüksektir, ortalama değeri 2'dir ve bu, tüm modeller arasında en yükseğidir. Ancak genel olarak, eğer fonlarınızı Grok 4.1'e teslim ederseniz, bu akıllıca bir seçim değildir.

GPT 5.1: Aşırı Dikkatli “Ölü Kısa” Kötümserler

GPT 5.1'in açılış tarzı ile Grok 4.1 tamamen zıttır. GPT 5.1, ihtiyatlılık açısından son derece titizdir ve çoğu durumda beklemeyi tercih etmiştir. Sonuç olarak 150 testin sadece 52'sinde işlem açılmıştır, ortalama açılış oranı ise yalnızca %0.34'tür.

Ancak, bu kadar dikkatli olmalarına rağmen, GPT 5.1'in daha iyi bir kazanma oranı elde etmesine yardımcı olamadı. En iyi senaryoda bile sadece %35 kazanma oranı elde etti. Ayrıca 4 saatlik ve 15 dakikalık uzun dönem açılışlarında, GPT 5.1'in açıkça daha yetenekli olmadığı görülüyor; teknik göstergelerin eklenmesine rağmen, 4 saatlik kazanma oranı sadece %27. 15 dakikalık periyotta ise, yüksek kazanç-kayıp oranı (2.02) sayesinde, ancak pozitif bir kazanç geri bildirimi elde edebildi ve nihai sonuç %9.9 oldu.

Ayrıca, GPT 5.1'in belirgin bir özelliği de açıkça pesimist olması ve kısa pozisyon almaya son derece hevesli olmasıdır. Siparişlerin %70'inden fazlası kısa pozisyondadır.

Qwen 3: Kelimeleri Altın Gibi Kullanan “Riskten Kaçınan”

Qwen 3, tüm testler arasında yalnızca 44 kez pozisyon açarak %29'luk bir açılış oranıyla en temkinli büyük model olduğu açıkça görülüyor. Ancak, GPT gibi, bu aşırı dikkat de daha yüksek bir kazanma oranı getirmedi. Kazanma oranı ortalama %34 seviyesinde; en iyi performans gösterdiği senaryo ise 4 saatlik gösterge içeren senaryo.

Ayrıca, Qwen 3'ün kâr-zarar oranı da oldukça yüksek. 1.96'ya ulaşıyor. Görünüşe göre bu, riskten kaçınan bir oyuncuya ait, daha az işlem yapma konusunda daha yetkin, ancak kârı sürdürme konusunda daha başarılı. 4 saatlik bant göstergeleri altında, Qwen 3'ün kâr beklentisi de en yakın kârı sağlıyor ve 0.95'e ulaşıyor, bu da tüm modeller arasında en yüksek olanı.

Veri toplama durumu

Özet:

Genel olarak, bu AI'ların simülasyon ticareti süreçlerinden şu noktaları çıkarabiliriz.

Birincisi, çoğu model için, göstergelerle birlikte olmak, sadece K çizgi grafiğinden daha güvenilir. Göstergelerle birlikte bu altı modelin ortalama kazanma oranı %38'e ulaşırken, göstergesiz durumda kazanma oranı sadece %30'dur.

İkincisi, AI kısa vadeli ticarette daha iyi olabilir, uzun vadeli ticarette değil. 15 dakikalık saf K-line senaryosunda, altı büyük modelin ortalama kazanma oranı %34, 4 saatlik periyodun %30'unun üzerindedir. Altı modelden üçü karlı (Gemini, GPT, Doubao) ve ortalama kâr zarar oranı genellikle daha iyidir.

Üçüncüsü, pozisyonu tamamen AI'ye devretmek uygun değildir. Bu test sürecinde, tüm AI modellerinin kar beklentisi 1'in altında kaldı, bu da uzun vadede bu tür bir kazanma oranı ve kar-zarar oranıyla bakıldığında, nihai sonuçlarının zarar olacağı anlamına geliyor. Sadece kaybetme hızlarının farkı vardır (ancak burada AI modelleri özel olarak eğitilmediği için kullanılan göstergeler de oldukça basit ve yaygın göstergelerdir). Bu nedenle, AI'nın sizin yerinize ticaret yapmasını istiyorsanız, daha karmaşık bir eğitim sürecine ve daha fazla geri test verisine ihtiyacınız olabilir.

Bu hesaplama gücü mücadelesi sona erdiğinde, hesap bakiyesinin son rakamlarına bakarken, belki de edindiğimiz en önemli ders “hangi model en güçlü” değil, “AI işlem sınırları nerede” olmuştur. Sonuç olarak, bugünün AI'sı belki de mükemmel bir portföy yöneticisini doğrudan ikame edemiyor, ancak tek taraflı olarak nispeten olgun bir işlem asistanı haline geldi; bazıları grafik okumada, bazıları risk yönetiminde, bazıları ise veri analizinde istikrarlı bir kazanma oranı elde etmede uzmandır. İnsanların AI'ya duyduğu artan beklentiler açısından, AI'nın insanları işlem yaparken ikame etmesini sağlamak hala karmaşık bir meseledir.

BTC1.16%

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.