Rehber

Veri Kalitesi: Hatalı Veri Nereden Doğar, Nasıl Önlenir? (2026)

Koray Çetintaş 10 Şubat 2026 4 dk okuma


Veri Kalitesi Nedir? Dört Temel Boyut

Veri Kalitesi Dashboard ve Metrikler

Veri kalitesi, tek bir metrik değil, çok boyutlu bir değerlendirmedir

Veri kalitesi, verinin amacına uygun kullanılabilirlik derecesidir. Yüksek kaliteli veri, is kararlarını destekler; düşük kaliteli veri işe yanlis yönlendirmelere neden olur. Veri kalitesi, dört temel boyutta değerlendirilir:

1. Accuracy (Doğruluk)

Verinin gerçek dünya değerlerini doğru yansitiyor olması. Bir müşterinin adresi “Ataturk Cad. No:15” işe, sistemdeki kayıt da aynı olmalı. Doğruluk hataları genellikle su şekillerde ortaya çıkar:

  • Yazım hataları: “Istnabul” yerine “Istanbul”
  • Değer hataları: Birim fiyat 100 yerine 1000 girilmesi
  • Referans hataları: Yanlis müşteri koduna bağlı sipariş
  • Ölçüm hataları: kg yerine gram girilmesi

2. Completeness (Tamllik)

Gerekli tüm veri alanlarının dolu olması. Eksık veri, analizleri yaniltir ve is süreçlerini engeller. Tamllik sorunları:

  • Zorunlu alan boşluğu: E-posta adresi olmayan müşteri kaydı
  • Kismi kayıt: Başka alanı dolu, ilçe/il alanı boş adres
  • Iliskisel eksiklik: Ürün kartına tanimli olmayan kategori
  • Geçmiş eksikliği: Fiyat degisiklik geçmişi tutulmamis ürün

3. Consistency (Tutarlılık)

Farklı sistemlerdeki verilerin birbiriyle uyumlu olması. Aynı verinin farklı yerlerde farklı şekillerde görünmesi, ciddi operasyonel sorunlara yol açar:

  • Format tutarsızlığı: Bir sistemde “TR-123456”, digerinde “123456”
  • Değer tutarsızlığı: CRM’de “Aktif”, ERP’de “Pasif” müşteri
  • Zamansal tutarsızlık: Sipariş tarihi, sevkiyat tarihinden sonra
  • Hesaplama tutarsızlığı: Farklı raporlarda farklı toplam ciro

4. Timeliness (Zamanlılik)

Verinin güncel ve zamanlında erişilebilir olması. Eski veri, yanlis kararlar demektir:

  • Geciken güncelleme: Fiyat artışı sistemde hala eski fiyatla
  • Geciken entegrasyon: Sipariş bilgisi ertesi gün ERP’ye düşüyor
  • Arsivlenmemis veri: 10 yıllık pasif kayıtlar aktif görünüyor
  • Geciken doğrulama: Adres değişikliği aylar sonra fark ediliyor

Ipucu

Veri kalitesi boyutları birbirinden bağımsız değildir. Örnegin, tutarsız veri genellikle güncel olmayan (timeliness sorunu) veriden kaynaklanır. Kök neden analizinde tüm boyutları birlikte değerlendirin.


Hatalı Veri Nereden Doğar? Kök Neden Analizi

Veri Analizi ve Hata Tespiti

Hatalı verinin kök nedenlerini anlamak, kalıcı çözümler üretmenin on koşulu

Veri kalitesi sorunlarının uc temel kaynagi vardır: Insan, Sistem ve Süreç. Her kaynak, farklı müdahale stratejileri gerektirir.

Insan Kaynaklı Hatalar

Manüel veri girişinin olduğu her noktada insan hatası potansiyeli vardır:

Veri Giriş Hataları

  • Klavye hataları: “1234” yerine “1243” yazmak
  • Kopyala-yapıştır hataları: Yanlis hucreyi kopyalamak
  • Format hataları: Tarih formatını yanlis girmek
  • Birim hataları: kg yerine adet girmek

Bilgi Eksikliği

  • Eğitim eksikliği: Alan anlamini bilmemek
  • Prosedür eksikliği: Doğru giriş yöntemini bilmemek
  • Referans eksikliği: Geçerli değerleri bilmemek

Kasıtlı Hatalar

  • Zaman baskısı: Hızlı giriş için zorunlu alanları atlamak
  • Sistem atlatma: Validasyonu geçmek için sahte değer girmek
  • Tembel giriş: “X”, “.” gibi placeholder değerler

Sistem Kaynaklı Hatalar

Teknik altyapı ve yazılım kaynakları hataları:

Entegrasyon Hataları

  • Mapping hataları: Yanlis alan eslemesi
  • Dönüşüm kayıpları: Karakter seti dönüşümünde veri kaybı
  • Senkronizasyon hataları: Zamanlama kaynakları uyumsuzluk
  • API hataları: Timeout sonrası kismi veri aktarımı

Yazılım Hataları

  • Bug’lar: Hesaplama veya kaydetme hataları
  • Default değerler: Yanlis atanan varsayılan değerler
  • Rounding hataları: Yuvarlama kaynakları tutarsızlık

Süreç Kaynaklı Hatalar

Is süreci ve yönetim kaynakları sorunlar:

Tasarım Eksiklikleri

  • Validasyon eksikliği: Giriş kontrolü olmayan alanlar
  • Standart eksikliği: Tanimlanmamis veri formatları
  • Dokümantasyon eksikliği: Veri sözlüğü olmaması

Yönetim Eksiklikleri

  • Sahipsiz veri: Data steward atanmamış alanlar
  • Izlenmeyen kalite: Metrik ve rapor eksikliği
  • Denetim eksikliği: Periyodik kontrol yapılmaması

Dikkat

Veri kalitesi sorunlarının %80’i süreç kaynaklarıdır. Teknoloji yatirimi yapmadan önce, veri giriş süreçleri, standartlar ve yönetişim modelini gözden geçirin. En pahalı yazılım bile kirli veriyi temizleyemez.


Validasyon Kuralları ve Veri Giriş Kontrolleri

Veri Validasyon Süreçleri

Proaktif validasyon, hatalı verinin sisteme girişmini engeller

Validasyon kuralları, hatalı verinin sisteme girmesini engelleyen ilk savunma hattidir. Uc seviyede tanimlanir:

Seviye 1: Format Validasyonu

Verinin teknik formatının kontrolü:

  • E-posta formatı: “xxx@domain.com” yapısi kontrolü
  • Telefon formatı: “+90 5XX XXX XX XX” yapısi
  • IBAN formatı: Ülke kodu + kontrol rakamı + BBAN
  • Tarih formatı: GG.AA.YYYY veya YYYY-MM-DD
  • Vergi numarası: 10 veya 11 haneli numerik

Seviye 2: Is Kuralı Validasyonu

Is mantigina uygünlük kontrolü:

  • Aralık kontrolleri: Birim fiyat > 0, stok >= 0
  • Liste kontrolleri: Ülke kodu geçerli listede mi?
  • Referans kontrolleri: Müşteri kodu sistemde var mi?
  • Mantık kontrolleri: Indirim oranı <= %100

Seviye 3: Cross-Field Validasyonu

Alanlar arası ilişki kontrolü:

  • Tarih ilişkileri: Sipariş tarihi <= Sevkiyat tarihi
  • Miktar ilişkileri: Sevk miktarı <= Siparis miktari
  • Tutar ilişkileri: Tutar = Miktar x Birim Fiyat
  • Kod ilişkileri: Il kodu + İlçe kodu uyumu

Validasyon Stratejileri

Giriş Anında Validasyon (Inline)

Kullanıcı veri girerken anında geri bildirim. En etkili yöntem, hatanın kaynağında engellenmesi.

Kayıt Anında Validasyon (On Save)

Kaydet butonu tıklandığında tüm alanların kontrolü. Birden fazla hatanın aynı anda gösterilmesi.

Batch Validasyon (Toplu)

Toplu veri yükleme veya entegrasyonda. Raporla hatalı satırlar, kullanıcıya düzeltme fırsatı ver.

Periyodik Validasyon (Scheduled)

Mevcut verilerin duzunli kontrolü. Zaman içinde kirlenmis verilerin tespiti.


Data Stewardship: Veri Yönetişimi Modelı

Veri kalitesi, bir kez yapılan değil sürekli yönetilen bir is. Data stewardship modelı, bu sürekliliği sağlar.

Data Steward Nedir?

Data steward, belirli bir veri alanının kalitesinden sorumlu is birimi temsilcisidir. IT değil, is birimi liderliğinde bir roldur. Sorumluluklar:

  • Veri standartlarını tanımlama ve dokümante etme
  • Kalite kurallarını belirleme
  • Veri sorunlarını inceleme ve çözümleme
  • Yeni kayıt açma taleplerini onaylama
  • Periyodik kalite raporlarını izleme

Data Steward Atama Örnekleri

  • Müşteri master: Satış Müdürü veya CRM Yöneticisi
  • Tedarikçi master: Satın Alma Müdürü
  • Ürün master: Ürün Yöneticisi veya R&D Müdürü
  • Finansal veri: Finans Müdürü veya Muhasebe Şefi
  • Çalışan verisi: IK Müdürü

Veri Yönetişimi Süreci

1. Tanımlama

  • Veri sözlüğü oluştur (her alanın tanımı, formatı, sahibi)
  • Kalite kuralları tanımla
  • Ölçüm metriklerini belirle

2. Ölçüm

  • Otomatik kalite skorlarını hesapla
  • Dashboard’larda görselleştir
  • Trend analizleri yap

3. Izleme

  • Eşik değerler tanımla (örn: doğruluk > %98)
  • Sapmalarda alarm oluştur
  • Düzeltici eylem basalt

4. İ̇yileştirme

  • Kök neden analizi yap
  • Süreç iyileştirmeleri uygula
  • Eğitimleri güncelle

Veri yönetişimi hakkında daha fazla bilgi için sektör bazlı çözümlerimizi inceleyebilirsiniz.


Sahadan Örnek: Üretim Firmesi Vakası

Gerçek Vaka (Markasız)

Üretim Tesisi Veri Yönetimi

Durum

85 çalışanli elektronik üretici firma. Yeni ERP sistemine geçiş öncesi veri kalitesi analizi yapıldı. Sonuçlar endişe vericiydi: Müşteri master’da %18 duplikasyon, ürün kodlarında %12 format tutarsızlığı, BOM’larda %8 eksık bileşen tanimli. Firma, bu sorunları çözmeden ERP’ye gocmeyi planlamisti.

Uygulanan Adımlar

  1. Hafta 1-2: Veri profilleme ve kalite ölçümu. Dört temel boyutta mevcut durum analizi yapıldı. Her veri kategorisi için sorun envanteri çıkarıldı.
  2. Hafta 3-4: Data steward atamaları. Müşteri verisi için Satış Müdürü, ürün verisi için Üretim Planlama Şefi, tedarikçi verisi için Satın Alma Müdürü atandı.
  3. Hafta 5-8: Temizlik ve standardizasyon. Duplike kayıtlar birlesitirildi, format standartları tanimlandi, eksık BOM bileşenleri üretimle doğrulandi.
  4. Hafta 9-10: Validasyon kurallarının sisteme entegrasyonu. Yeni ERP’de 47 format, 23 is kuralı ve 12 cross-field validasyonu tanimlandi.
  5. Hafta 11-12: Kalite izleme dashboard’u ve periyodik raporlama mekanizmesi kuruldu. Haftalık kalite skorkart toplantıları başlatıldı.

Sonuç (Temsili)

  • Müşteri duplikasyon oranı: %18 -> %0.5 (göç sonrası)
  • Ürün kodu format tutarlılığı: %88 -> %99.2
  • BOM tamllik oranı: %92 -> %99.8
  • ERP göç süresi: Planlanan 6 ay yerine 4.5 ayda tamamlandı
  • Go-live sonrası veri kaynaklı destek talepleri: Sektör ortalamasının %60 altında

Veri Kalitesinde En Sik Yapılan 7 Hata

1. Veri Kalitesini IT Sorunu Olarak Görmek

Veri kalitesi teknik değil, is problemidir. IT araç sağlar, ancak veri kalitesi kararları ve sahipliği is birimlerinde olmalıdir. Data steward’lar IT’den değil, Satış, Finans, Operasyon’dan gelmelidir.

2. Tek Seferlik Temizlik Yapmak

“Bir kere temizledik, tamam” yaklaşimi. Veri sürekli kirlenir. Validasyon kuralları, izleme mekanizmaları ve periyodik denetimler olmadan temizlik geçici kalır.

3. Validasyon Olmadan Veri Kabul Etmek

Kullanıcıların her değer girmesine izin vermek. “Sonra düzeltiriz” düşüncesi. Hatalı verinin kaynağında engellenmesi, sonradan temizlemekten çok daha ucuz ve etkilidir.

4. Veri Standartlarını Dokümante Etmemek

Herkesin farklı format kullanması. “Nasıl girmemiz gerekiyor?” sorusuna cevap olmaması. Veri sözlüğü ve giriş standartları dokümante edilmeli ve erişilebilir olmalıdir.

5. Kalite Metriklerini Ölçmemek

“Veri kalitemiz iyi” deyip ölçüm yapmamak. Ölçemediginizi yönetemezsiniz. Her veri kategorisi için doğruluk, tamllik, tutarlılık ve zamanlılik metrikleri tanimlanmali.

6. Sadece Kritik Hatalar İ̇çin Müdahale Etmek

Küçük kalite sorunlarını görmezden gelmek. Birikmiş küçük hatalar, büyük krizlere dönüşür. Proaktif izleme ve erken müdahale şart.

7. Kullanıcı Eğitimini Atlamak

Sistem kuruldu, validasyonlar tanimlandi ama kullanıcılar neden ve nasıl doğru veri gireceklerini bilmiyor. Eğitim olmadan davranış degisikigi olmaz.

Veri Kalitesi Analizi

Sistematik yaklaşim hataları engeller


Veri Kalitesi Başarı Metrikleri

Veri kalitesini yönetmek için ölçmeniz gereken temel metrikler (temsili hedef değerler):

Metrik Baslangic Hedef Ölçüm Yöntemi
Doğruluk Oranı (Accuracy) %85-90 >%98 Örneklem doğrulama + otomatik kontrol
Tamllik Oranı (Completeness) %70-80 >%95 Boş alan sayısı / Toplam zorunlu alan
Tutarlılık Oranı (Consistency) %80-85 >%99 Sistemler arası karşılaştırma raporları
Zamanlılik Oranı (Timeliness) %75-85 >%95 SLA uyum oranı + güncelleme gecikme süresi
Duplikasyon Oranı %5-15 <%1 Fuzzy matching ile duplike tespit
Validasyon Ret Oranı %10-20 <%3 Reddedilen kayıt / Toplam giriş denemesi
Veri Sorunu Çözüm Süresi 5-10 gün <2 gun Sorun tespiti – çözüm arası ortalama süre
Data Steward Kapsamı %30-50 %100 Sahipli veri alanı / Toplam veri alanı

Bu metrikleri haftalık veya aylık periyotlarla takip edin ve trend analizleri yapın.


Veri Kalitesi Kontrol Listesi

Aşağıdaki kontrol listesi, veri kalitesi programiniz için kapsamlı bir rehberdir:

A. Yönetişim ve Organizasyon
  • Her master data kategorisi için data steward atandı
  • Veri kalitesi politikası yazıldı ve onaylandı
  • Kalite hedefleri ve KPI’lar belirlendi
  • Eskalasyon prosedürü tanimlandi
B. Veri Standartları
  • Veri sözlüğü (data dictionary) oluşturuldu
  • Format standartları (tarih, telefon, adres) dokümante edildi
  • Kodlama standartları (müşteri kodu, ürün kodu) tanimlandi
  • Referans veri listeleri (ülke, sektör, kategori) merkezi tutulduyor
C. Validasyon Kuralları
  • Format validasyonları sisteme entegre edildi
  • Is kuralı validasyonları tanimlandi
  • Cross-field validasyonları aktif
  • Toplu veri yükleme için validasyon raporu mevcut
D. Ölçüm ve Izleme
  • Otomatik kalite skoru hesaplanıyor
  • Kalite dashboard’u oluşturuldu
  • Periyodik kalite raporları üretiliyor
  • Eşik değerleri aşımında alarm mekanizmesi var
E. Düzeltici Eylemler
  • Veri sorunu raporlama mekanizmesi mevcut
  • Kök neden analizi prosedürü tanimlandi
  • Düzeltici eylem takibi yapılıyor
  • Tekrarli sorunlar için süreç iyileştirmesi yapılıyor
F. Eğitim ve Farkindelik
  • Veri giriş standartları eğitimi verildi
  • Data steward’lar için rol eğitimi verildi
  • Veri kalitesi farkindelik programı var
  • Yeni çalışanlar için veri eğitimi oryantasyona dahil

Sikca Sorulan Sorular (SSS)

Veri kalitesi, is kararlarının guvenilirligini doğrudan etkiler. Düşük kaliteli veri, hatalı raporlama, yanlis tahminler, müşteri kaybı ve operasyonel verimsizliğe yol açar. Temsili araştırmalara göre, işletmelerin yıllık gelirlerinin %15-25’i veri kalitesi sorunlarından kaynaklanan maliyetlere gidebilmektedir.

Veri kalitesinin dört temel boyutu vardır: Accuracy (doğruluk) – verinin gerçek dünya değerlerini yansitiyor olması, Completeness (tamllik) – gerekli tüm alanların dolu olması, Consistency (tutarlılık) – farklı sistemlerdeki verilerin birbiriyle uyumlu olması, ve Timeliness (zamanlılik) – verinin güncel ve zamanlında erişilebilir olması.

Hatalı veri uc ana kaynaktan doğar: Insan faktörü (manüel veri girişi hataları, kopyala-yapıştır hataları, yanlis format kullanımi), Sistem faktörü (entegrasyon hataları, dönüşüm kayıpları, senkronizasyon problemleri) ve Süreç faktörü (eksık validasyon kuralları, belirsiz veri sahipliği, yetersiz veri yönetişimi).

Veri kalitesi, boyut bazlı metriklerle ölçülür: Doğruluk oranı (yanlis kayıt sayısı / toplam kayıt), Tamllik oranı (boş alan sayısı / toplam alan), Tutarlılık oranı (uyumsuz kayıt sayısı / toplam kayıt), Zamanlılik oranı (güncel olmayan kayıt sayısı / toplam kayıt). Bu metrikler duzunli olarak ölçülmeli ve raporlanmalidir.

Data steward, belirli bir veri alanının kalitesinden sorumlu is birimi temsilcisidir. Veri standartlarını tanımlar, kalite kurallarını belirler, veri sorunlarını çözümler ve yeni kayıt açma prosedürlerini yönetir. IT değil, is birimleri liderliğinde bir roldur. Her master data kategorisinin bir data steward’i olmalıdir.

Validasyon kuralları uc seviyede tanimlanir: Format validasyonu (e-posta formatı, telefon formatı, tarih formatı), Is kuralı validasyonu (birim fiyat > 0, stok miktarı >= sipariş miktarı), ve Cross-field validasyonu (ülke kodu + telefon formatı uyumu, fatura tarihi <= sevkiyat tarihi). Kurallar sisteme entegre edilmeli ve giris aninda kontrol edilmelidir.


Yazar Hakkında

Koray Çetintaş, dijital dönüşüm, ERP mimarisi, süreç mühendisliği ve stratejik teknoloji liderliği alanlarında uzman danışmandır. Yapay zekâ, IoT ekosistemleri ve endüstriyel otomasyon konularında saha deneyimi ile "Strateji + İnsan + Teknoloji" yaklaşımını uygular.

Projeniz İçin Destek Alın

Dijital dönüşüm yolculuğunuzda size rehberlik edebilirim. Ücretsiz ön görüşme için randevu alın.