Apify Web Sitesi İçerik Tarayıcısından veri yükleyin.
Apify, Actors adı verilen binden fazla hazır bulut aracı içeren bir uygulama mağazası sağlayan bir web kazıma ve veri çıkarma platformudur.
The Website Content Crawler Actor, web sitelerini derinlemesine tarayabilir, çerez modlarını, altbilgileri veya gezinmeyi kaldırarak HTML'lerini temizleyebilir ve ardından HTML'yi Markdown'a dönüştürebilir. Bu Markdown daha sonra semantik arama veya Alma-Artırılmış Üretim (Retrieval-Augmented Generation(RAG)) için bir vektör veritabanında saklanabilir.