Bilgisayarlı Görü, bilgisayarların ve sistemlerin dijital görüntülerden, videolardan ve diğer görsel girdilerden anlamlı bilgiler çıkarmasını sağlayan bir yapay zeka alanıdır. Makinelerin sadece "görmesini" değil, gördüklerini bir insan gibi "anlamlandırmasını" hedefleyen bu teknoloji; otonom araçlardan tıbbi teşhis sistemlerine kadar modern dünyanın en devrimsel uygulamalarının temelini oluşturur.
Bilgisayarlı Görü (Computer Vision) Nedir?
İnsan görme sistemi, bir nesneyi gördüğünde onu anında tanıyabilir ve mesafesini algılayabilir. Bilgisayarlı görü, bu yeteneği matematiksel algoritmalar ve pikseller aracılığıyla taklit eder. Bir bilgisayar için bir görüntü, sadece 0 ile 255 arasında değişen sayısal değerlerden oluşan devasa bir matristir. Bilgisayarlı görü algoritmaları, bu sayı yığınları içindeki kenarları, dokuları, şekilleri ve sonunda nesnelerin kendisini tespit etmek için "Evrişimli Sinir Ağları" (CNN) adı verilen karmaşık yapılar kullanır.
Bilgisayarlı Görü Nasıl Çalışır?
Süreç genellikle şu aşamalardan oluşur:
- Görüntü Edinme: Kamera veya sensörler aracılığıyla verinin dijital ortama aktarılması.
- Görüntü İşleme: Gürültülerin temizlenmesi, netleştirme ve kontrast ayarları gibi ön hazırlıklar.
- Nesne Tespiti (Object Detection): Görüntü içindeki belirli objelerin sınırlarının belirlenmesi.
- Sınıflandırma ve Segmentasyon: Tespit edilen objenin ne olduğunun (Araba, insan, trafik ışığı) belirlenmesi ve piksellerine kadar ayrıştırılması.
Kullanım Alanları: Makineler Neyi Görüyor?
Bilgisayarlı görü, hayatımızın hemen her noktasında aktif bir güvenlik ve verimlilik unsuru olarak yer alır. Otonom araçlar (Tesla vb.), çevrelerindeki yayaları ve şeritleri bu teknolojiyle fark eder. Sağlık sektöründe, MR ve tomografi sonuçlarındaki anomali ve tümörleri uzman doktorlardan bile daha hızlı tespit edebilir. Akıllı telefonlardaki yüz tanıma (FaceID) sistemleri ve fabrikalardaki hatalı ürünleri saniyeler içinde ayıran robotik kollar, tamamen bu görsel zekaya dayanır.
Bu Teknolojinin Öncüleri Kimlerdir?
Bilgisayarlı görünün temelleri 1960'larda Larry Roberts'ın "üç boyutlu objelerin iki boyutlu görüntülerden çıkarılması" üzerine yazdığı tezle atılmıştır. 1980'lerde Kunihiko Fukushima'nın geliştirdiği "Neocognitron", modern sinir ağlarının atası sayılır. Günümüzde ise bu alanın en etkili ismi, dünyanın en büyük görsel veri tabanı olan ImageNet'i kuran ve derin öğrenme devrimini tetikleyen Fei-Fei Li'dir. Ayrıca, görüntülerdeki öznitelikleri bulmaya yarayan SIFT algoritmasının yaratıcısı David Lowe da bu alanın devleri arasındadır.
Sıradışı Bilgiler: Görsel Zekanın İlginç Gerçekleri
- Piksel Karmaşası: Bir bilgisayar bir resmi "görmez", onun için bir görüntü sadece milyonlarca rakamın olduğu bir tablodur. Biz bir kedi görürüz, o ise binlerce 145, 23, 110 değerini görür.
- Optik İllüzyonlar: İnsanları yanıltan bazı optik illüzyonlar, bilgisayarlı görü sistemlerini yanıltamaz; çünkü onlar biyolojik bir beyin gibi varsayımlarda bulunmak yerine sadece ham piksel verisini işlerler.
- Mili Saniyeler İçinde Karar: Modern sistemler, saniyede 60 kareden fazla akan yüksek çözünürlüklü videolarda her bir karedeki yüzlerce objeyi aynı anda tanıyıp takip edebilir.