Belge Depoları
AIFINEX Flow Belge Depolarını nasıl kullanacağınızı öğrenin
Last updated
AIFINEX Flow Belge Depolarını nasıl kullanacağınızı öğrenin
Last updated
AIFINEX Flow'un Belge Depoları, veri yönetimine çok yönlü bir yaklaşım sunarak verilerinizi tek bir konumda yüklemek için yüklemenize, bölmenize ve hazırlamanıza olanak tanır.
Bu merkezi yaklaşım, veri işlemeyi basitleştirir ve çeşitli veri biçimlerinin verimli bir şekilde yönetilmesine olanak tanıyarak verilerinizi AIFINEX Flow uygulaması içinde düzenlemeyi ve bunlara erişmeyi kolaylaştırır.
Bu eğitimde, LLM'lerin muhtemelen kapsamlı bir şekilde eğitilmediği bir konu olan LibertyGuard Deluxe Homeowners Policy hakkında bilgi almak için bir sistemi kuracağız.
AIFINEX Flow Belge Deposunu kullanarak, LibertyGuard ve home insurance policies hakkında veri hazırlayıp ekleyeceğiz. Bu, RAG sistemimizin LibertyGuard'ın home insurance teklifleri hakkındaki kullanıcı sorgularını doğru bir şekilde yanıtlamasını sağlayacaktır.
Bir Belge Deposu ekleyip adlandırarak başlayın. Bizim durumumuzda, "LibertyGuard Deluxe Homeowners Policy".
İlk olarak, PDF dosyamızı yükleyerek başlıyoruz.
Ardından, benzersiz bir metadata anahtarı ekliyoruz. Bu isteğe bağlıdır, ancak daha sonra gerekirse aynı veri kümesini hedeflememize ve filtrelememize izin verdiği için iyi bir uygulamadır.
Parçalama işleminden memnun kaldığınızda, verilerinizi işleme koymanın zamanı geldi.
Verilerinizi işledikten sonra, parçalarınızı silerek veya veri ekleyerek düzenleyebileceğinizi unutmayın. Bu, aşağıdaki durumlarda faydalıdır:
Orijinal verilerde yanlışlıklar veya tutarsızlıklar keşfedersiniz: Parçaları düzenlemek, hataları düzeltmenize ve bilgilerin doğru olduğundan emin olmanıza olanak tanır.
İçeriği daha iyi alaka düzeyi için hassaslaştırmak istiyorsunuz: Belirli bilgileri vurgulamak veya alakasız bölümleri kaldırmak için parçaları ayarlayabilirsiniz.
Belirli sorgular için öbekleri uyarlamanız gerekir: Parçaları düzenleyerek, almayı beklediğiniz soru türlerine daha hedefli hale getirebilirsiniz.
Son olarak, Retrieval-Augmented Generation (RAG) sistemimiz çalışır durumda. LLM'nin sorguyu nasıl etkili bir şekilde yorumladığı ve kapsamlı bir yanıt oluşturmak için parçalanmış verilerden ilgili bilgileri nasıl başarılı bir şekilde kullandığı dikkat çekicidir.
LibertyGuard Deluxe Homeowners Policy verilerini düzenlemek için bir Belge Deposu oluşturarak başladık. Bu veriler daha sonra yüklenerek, parçalara ayrılarak, işlenerek ve onaylanarak hazırlandı ve RAG sistemimiz için hazır hale getirildi.
Organizasyon ve Yönetim: Belge Deposu, verilerimizi depolamak, yönetmek ve hazırlamak için merkezi bir konum sağlar.
Veri Kalitesi: Parçalama işlemi, verilerimizin doğru bir şekilde alınmasını ve analiz edilmesini kolaylaştıracak şekilde yapılandırılmasını sağlamaya yardımcı olur.
Esneklik: Belge Deposu, verilerimizi gerektiği gibi iyileştirmemize ve ayarlamamıza olanak tanıyarak RAG sistemimizin doğruluğunu ve uygunluğunu artırır.
Az önce oluşturduğumuz Belge Deposu'na girin ve kullanmak istediğiniz seçin. Bizim durumumuzda, veri setimiz PDF formatında olduğu içinkullanacağız.
Son olarak, verilerinizi parçalamak için kullanmak istediğiniz 'yü seçin. Bizim özel durumumuzda, yı kullanacağız.
Artık mevcut yapılandırmamızı kullanarak verilerimizin nasıl parçalanacağını önceden görebiliriz; chunk_size=1500
ve chunk_overlap=750
.
Belirli veri kümeniz için en uygun yapılandırmayı bulmak için farklı , Yığın Boyutları ve Örtüşme değerleriyle denemeler yapmak önemlidir. Bu önizleme, parçalama işlemini iyileştirmenize ve elde edilen parçaların RAG sisteminiz için uygun olduğundan emin olmanıza olanak tanır.
Artık veri kümemiz onaylanmaya hazır olduğuna göre, RAG sohbet akışınıza / aracılık akışınıza gitmenin ve LangChain > Belge Yükleyici bölümünün altına eklemenin zamanı geldi.
Akışınızın sağ köşesindeki yeşil düğmeye tıklayarak veri kümenizi yükseltin. Uygulamamızda kullandık.