📋

Professional Experience

Coşkunöz Holding 📍 Bursa, Türkiye

Software Developer 🗓️ 2022 - Present
- Developed and deployed AI-powered solutions in industrial settings, focusing on Generative AI, LLMs, Computer Vision, and Machine Learning to optimize production workflows and quality control.
- Designed and implemented RAG pipelines using Vektor databases for intelligent document retrieval and domain-specific knowledge integration.
- Designed and deployed LLM orchestration pipelines with LangChain, CrewAI, and n8n, integrating MCP tools to power intelligent chatbots, document Q&A systems, and AI assistants via Streamlit.
- Applied LoRA and other parameter-efficient fine-tuning techniques for domain-adapted LLM enhancements.
- Designed and deployed automated quality inspection systems using YOLO, OpenCV, OCR, and PyTorch, reducing manual checks and improving accuracy by up to 95%.
- Created AI systems that enabled forklift-human collision detection, resulting in a 90% reduction in workplace accidents, awarded in the MESS Occupational Safety Stars Competition.
- Built operator monitoring systems that prevented faulty products, winning Tofaş Best Kaizen Award, TİSK Digitalization Award, and Ministry of Industry and Technology Productivity Project Award.
- Developed edge AI systems on Jetson Nano and Raspberry Pi, enabling low-latency inference for real-time industrial scenarios.
- Implemented microservices with FastAPI, Django, and .NET Core, and managed API integration and deployment using Docker and CI/CD pipelines.
- Integrated IoT sensor data and PLC communication (e.g., snap7) for fault detection and signal processing in live production environments.
- Leveraged SQL, NoSQL, and ORM frameworks to manage complex data flows and enable real-time dashboards via Power BI, Tableau, and Grafana.
- Used RPA (Robotic Process Automation) to streamline document processing workflows, achieving annual savings of €11,000.
- Conducted large-scale data processing using Apache Spark, Hadoop, and Kafka, with real-time visualization.
- Experienced in prompt engineering, LLM model evaluation, and staying up to date with multi-agent architectures, hybrid search, and AI trends.
- Experienced in leading cross-functional teams and collaborating across departments to deliver end-to-end AI solutions in production environments.

🎓

Education

Bursa Technical University 📍 Bursa, Türkiye

BSc in Mechanical Engineering 🗓️ 2018 - 2023
- Graduated with GPA 2.97. TEKNOFEST participant with HACİWATT team.
Istanbul University 📍 Istanbul, Türkiye

Associate Degree in Computer Programming 🗓️ 2022 - 2024
- Focus on software development, backend, databases, and algorithms.
- Expected graduation with GPA 2.8.

🏅

Certifications

Miuul 📍 Online
BTK Academy 📍 Online
- Advanced Python Programming from Scratch
Global AI Hub 📍 Online
- Deep Learning Bootcamp

RAG Notlarım-3

Yapay zeka destekli bilgi alma sistemlerinde RAG (Retrieval-Augmented Generation) mimarileri, özellikle bilgi yoğun görevlerde doğruluğu artıran güçlü bir yaklaşımdır. Bu yazı dizisinin ilk iki bölümünde, RAG'in temel yapısını, bileşenlerini ve kullanım alanlarını inceledik. Şimdi ise serimizin üçüncü bölümünde, bir RAG sisteminin verimliliğini ve doğruluğunu artırmak için hangi optimizasyon tekniklerinin kullanılabileceğini derinlemesine ele alacağız.

RAG pipeline'ı, genel olarak üç ana aşamada optimize edilebilir:

Getirme Öncesi (Pre-Retrieval)
Getirme (Retrieval)
Getirme Sonrası (Post-Retrieval)

Bu yazıda, her aşamayı detaylarıyla inceleyip, kullanılan yöntemleri örneklerle açıklayacağım. Hedefimiz, sadece çalışan değil, ölçeklenebilir, hızlı ve akıllı bir bilgi alma süreci tasarlamak. Şimdi gelin, bu sürecin ilk adımıyla başlayalım.

1. Pre-Retrieval (Getirme Öncesi)

RAG mimarisinde, en doğru ve alakalı bilginin getirilmesi için sürecin daha arama motoruna (veya vektör veritabanına) ulaşmadan optimize edilmesi büyük önem taşır. Bu aşama, hem sorgunun yapısını iyileştirmeyi hem de dokümanların daha anlamlı parçalara ayrılmasını hedefler.

1.1 Query Optimization (Sorgu Optimizasyonu)

İyi yapılandırılmış bir sorgu, hatalı veya alakasız veri getirme olasılığını büyük oranda azaltır. Bu nedenle aşağıdaki yöntemler kullanılarak sorgular zenginleştirilir ya da hedefe daha uygun hale getirilir:

HyDE (Hypothetical Document Embeddings)

LLM kullanılarak, sorguya karşılık gelecek varsayımsal bir cevap (hipotetik doküman) oluşturulur. Bu cevap embedding'e dönüştürülerek vektör arama bu embedding ile yapılır.

Bu yaklaşım, doğrudan sorgunun değil, onun olası cevabının temsilini kullanarak daha isabetli sonuçlar elde edilmesini sağlar.

Multi-Query

Bir sorgunun farklı versiyonları LLM ile otomatik üretilir (parafraz, detaylandırma, sadeleştirme).

Her bir sorgu için ayrı aramalar yapılır ve sonuçlar birleştirilir. Bu yöntem, bilgi çeşitliliğini artırır ve kayıpları azaltır.

Self Query

LLM, gelen doğal dil sorgusunu analiz ederek, vektör veri tabanına uygun yapısal bir filtre üretir.

Örneğin: "Ocak 2024'teki satış raporları" gibi bir sorguda LLM, tarih filtresi uygulayabilir. Bu sayede yalnızca ilgili dokümanlar sorguya dahil edilir.

Routing, Rewriting, Expansion

Routing: Sorgu farklı alt sistemlere veya veri kaynaklarına yönlendirilir.
Rewriting: Sorgu, daha etkili hale getirilmek için yeniden yazılır.
Expansion: Anahtar kelimeler veya kavramlarla sorgu genişletilir.

Bu teknikler, sorgunun anlamını bozmadan daha güçlü hale getirilmesini sağlar.

1.2 Chunking Optimization (Parçalama Optimizasyonu)

RAG sistemlerinde dokümanların doğrudan tüm haliyle işlenmesi yerine, anlamlı parçalara ayrılması ("chunking") tercih edilir. Bu, hem sorgu ile eşleşmeyi artırır hem de getirme sürecinin verimliliğini yükseltir. Ancak bu parçalama işlemi doğru yapılmazsa, bilgi kaybı veya alakasız sonuçlar doğabilir. Aşağıda chunking sürecini optimize etmeye yönelik üç temel yöntem yer alıyor:

Parent Document Retrieval

Her bir parçanın hangi ana dokümana ait olduğunu saklayarak, sorgu ile eşleşen parça bulunduktan sonra ilgili tüm üst dokümanı da getirme sürecine dahil eder.

Bu yöntem, küçük bir bilgi parçası üzerinden daha zengin bir bağlam sunulmasını sağlar.

Sentence Window

Metinler sabit uzunlukta değil de cümle temelli ve kayan pencere yaklaşımıyla bölünür.

Örneğin, her parça 3 cümleden oluşur ve bir sonraki parça öncekiyle örtüşür. Bu teknik sayesinde:

Anlam bütünlüğü korunur.
Bilgi bölünmesi minimize edilir.
Embedding kalitesi artar.

Semantic Chunker

Cümleleri veya paragrafları anlamsal bütünlüğe göre gruplayarak parçalara ayırır.

Burada LLM veya özel modellerle, metnin anlamını bozmadan optimal bölümler çıkarılır.

Bu sayede hem sorguyla daha iyi eşleşen parçalar seçilir hem de retrieval aşamasında bilgi kaybı azaltılır.

2. Retrieval (Getirme)

Bu aşama, sorgunun embedding'ini oluşturup vektör veritabanına gönderdiğimiz ve sonuçları geri aldığımız yerdir. Fakat basit bir nearest neighbor araması her zaman yeterli olmaz. Bu nedenle bu aşamada kullanılan optimizasyonlar iki ana başlıkta toplanır: Embedding Fine Tuning ve Search Optimization.

2.1 Embedding Fine Tuning (Vektör Temsili İyileştirme)

LLM ya da embedding modelinin "neye benzer" sorusuna verdiği cevap sistemin kalitesini doğrudan etkiler. Bu yüzden embedding kalitesini artırmak büyük fayda sağlar.

Fine Tuning Embeddings

Önceden eğitilmiş embedding modelleri, her görev için ideal olmayabilir. Bu nedenle kendi veri setimize özel olarak fine-tune edilmiş embedding modelleri kullanmak, sorgu-belge eşleşmesini ciddi anlamda iyileştirir.

Özellikle domain-specific (örneğin finans, tıp) alanlarda bu fark daha da belirgindir.

Late Interaction (ColBERT tarzı)

Bu yaklaşımda, sorgu ve doküman embedding'leri ayrı ayrı tutulur, yalnızca son adımda daha ince ayrıntılı karşılaştırma yapılır.

Avantajları:

Daha doğru sıralama
Daha iyi semantik eşleşme

Ancak işlem yükü klasik dot product aramaya göre daha fazladır.

2.2 Search Optimization (Arama Stratejisi Geliştirme)

Burada amaç, arama algoritmalarını geliştirerek daha doğru, çeşitli ve dengeli bilgi getirebilmektir.

MMR (Maximal Marginal Relevance)

MMR, getirme sonuçlarını seçerken çeşitlilik ve alaka arasında denge kurar.

Örneğin, ilk 5 sonuç çok benzerse, 6. sonuç daha farklı ama hâlâ alakalı bir içerik olabilir. Bu yöntemle bilgi tekrarından kaçınılır.

Hybrid Search

Vektör arama ile klasik anahtar kelime bazlı (BM25 gibi) aramalar birleştirilir.

Bu yöntem hem:

Semantik benzerlik (embedding),
Hem de kelime düzeyi eşleşme (keyword match) sağlar.

Özellikle sorgu kısa ve belirsizse, hybrid search başarıyı ciddi ölçüde artırır.

Retrieval aşamasında, daha isabetli, anlamlı ve çeşitli bilgi getirmek için kullanılan bu teknikler sayesinde, RAG sistemleri çok daha etkili hale gelir.

3. Post-Retrieval (Getirme Sonrası)

Bu aşamada, retrieval sonucu gelen içerikler doğrudan LLM'e sunulmaz. Önce bir süzgeçten geçirilir, sıkıştırılır, sıralanır. Böylece model, yalnızca en anlamlı ve bağlama uygun bilgiye erişmiş olur. Bu hem doğruluğu hem de yanıt kalitesini artırır.

3.1 Contextual Compression (Bağlamsal Sıkıştırma)

Getirilen belgeler ya da chunk'lar, LLM ya da özel modeller kullanılarak önemli bilgiye göre filtrelenir veya özetlenir.

Amaç, gereksiz veya ilgisiz detayları atmak, yalnızca "cevap için işe yarar" içeriği LLM'e sunmaktır.

Bu işlem LLM ile yapılırsa: Örneğin "Bu içerikten yalnızca sorguyla alakalı 3 cümleyi bırak" diyebiliriz.
Alternatif olarak retriever/encoder modellerle skorlanıp düşük puanlı içerik elenir.

Bu sayede:

Token israfı azalır
Yanıt süresi ve kalitesi artar

3.2 Reranking (Yeniden Sıralama)

Getirilen belgeler ya da chunk'lar, ilk sıralamadan bağımsız olarak LLM veya bir sıralayıcı model aracılığıyla tekrar değerlendirilip en alakalı olanlar yukarı alınır.

Örneğin: Top 20 sonuç getirildi, ama ilk sıradaki alakasız.

Bir reranker (BGE, monoT5 vb.) bu sonuçları sorguya göre yeniden puanlayarak en iyi eşleşmeleri yukarı alır.

Bu özellikle çok sayıda veri getirildiğinde önemlidir. Doğru içeriği üstte tutarak yanıltıcı sonuçların etkisini azaltır.

RAG sistemleri, özellikle bilgiye dayalı uygulamalarda doğruluk ve güvenilirlik açısından güçlü bir mimari sunuyor. Ancak bu gücü tam anlamıyla ortaya koymak için sadece temel yapıyı kurmak yetmez; öncesi, sırası ve sonrası ile birlikte optimize edilmiş bir bilgi getirme süreci gerekir.

Bu yazıda incelediğimiz optimizasyon teknikleri, RAG sistemlerinizi bir sonraki seviyeye taşıyacak araçlar sunuyor. Her aşamada doğru teknikleri seçerek, hem performansı hem de doğruluğu önemli ölçüde artırabilirsiniz.