Odtü İstatistik Kulübü ile Verinin Kadim Dili SQL Etkinliği

ODTÜ İstatistik Kulübü’nün ev sahipliğinde canlı bir eğitim gerçekleştirdik.
350 tekil izleyicinin canlı izlediği eğitimimiz cevval katılımcılardan gelen talep üzerine 2 saat civarında planlanmışken 4 saat kesintisiz sürdü.
Bu 4 saat için de ise şunları öğrendik.
-Veritabanı Kavramı
-Veritabanı Yönetim Sistemi Kavramı
-Sanal Makine Kavramı
-Sanal Makine kurulumu (VMWare üzerine Windows Server 2016)
-SQL Server kurulumu (Server işletim sistemi üzerine bilinçli ve doğru şekilde kurulum yapma)
-Normalizasyon ve veritipleri
-SQL Komutları (Select,Insert,Update,Delete,Truncate)
-Where Condition kullanımı
-Order by komutu
-Aggregate functions (Sum,min,max,avg,count)
-Group By kavramı (uygulamalı ve örnek senaryo çözümlü)
-Having kullanımı
İlişkisel veritabanı kavramı
Join kavramı, çeşitleri ve uygulamaları

konularını uygulamalı ve gerçek verisetleri üzerinde gerçekleştirdik.
Kaçıranlar ya da tekrar izlemek isteyenler buradaki linkten izleyebilirler.
İlginize tekrardan çok teşekkür ederim.
ODTÜ İstatistik METU STAT

Microsoft MVP oldum!

Aralık başında Data Platform kategorisinde Microsoft MVP seçildiğim haberini paylaşmıştım. Ödülüm de elime ulaştı. Doğum günümden yaklaşık bir hafta kadar sonra.
Sanırım daha güzel bir doğum günü hediyesi olamazdı.
Çok teşekkürler MVP Award.

Hayatımda çok çok önemli bir kilometre taşı oldu.
İnşallah bundan sonraki hedefim halkaları çoğaltmak olacak.
Bu konuda Hakan UzunerDaron Yondem ve Dr. Erdal Ozkaya gibi bu işin kitabını yazanların tavsiyelerini bolca dinlemek gerek. 😊

#mvpbuzz

Sen SQL’i ne sandın webcast.

Kablosuz Beyin , Eru Wib ve DSC Erciyes topluluklarının düzenlemiş olduğu “Sen SQL’i ne sandın?” isimli etkinliğimizi gerçekleştirdik.
Canlı atölye formatında olan etkinliğimize gerek Youtube gerekse Teams üzerinden yaklaşık 250 kişi katıldı.
Bir iki kez yaptığımız 5’er dakikalık kamera pil değiştirme aralarını saymazsak kesintisiz 4 saat civarında süren çok keyifli bir etkinlik oldu.

-Büyük veri
-Veritabanı güvenliği
-TSQL’in incelikleri
-Verisetlerini oluşturma
-Fulltext search
-Json veri ile çalışma
-Sorgu performansı

gibi her biri bir atölyenin konusu olabilecek konularda gerçek uygulamalar gerçekleştirdik.

Umarım katılımcılar hem keyif almıştır hem de faydalanmıştır.
Başka bir etkinlikte görüşmek dileğiyle…

Datasetleri Nasıl Hazırlıyorum -1

Veribilimi ile uğraşanlar için gerçek veri çok önemli. Ancak bu veriyi her zaman hazır bulamayabiliyoruz. Bu anlamda hem başka kaynaklardan bulduğumuz verileri çekme hem de kendi verilerimizi generate etme konularında bir video serisi hazırlamaya başladım.
Bunun için çeşitli örnekler gösteriyor olacağım.
Bu videoda Worldometers. info sitesindeki covid19 verilerinin yayınlandığı sayfadaki ABD verilerini Json formatında canlı olarak çekip MSSQL’e sadece transact sql kullanarak nasıl aktarıldığını anlatıyorum.
En az 3 videodan oluşacak olan bu video serisini aşağıdaki playlistten izleyebilirsiniz.

SQL Server üzerinde TMDB sitesi verilerinin analizi

Arkadaşlar merhaba,
Benim eğtimlerimde gerçek hayat senaryoları ve gerçek verilere herkes alıştı artık.
Sizler için mükemmel bir veriseti ve eğitim hazırladım. Sadece dataseti hazırlamaya neredeyse 10 gündür uğraşıyorum. Ama gerçekten çok güzel bir veri seti oldu.
Üzerinde harika alıştırmalar yapacağız.

TMDB sitesinde bulunan
160.000’den fazla film
450.000’den fazla aktör
400.000’den fazla film personeli
10.000’den fazla yorum
200.000’den fazla resim
48.000’den fazla yapımcı şirket
1.500.000’den fazla film önerisi.
Bu verileri tam 20 dilde çeviri imkanı.

Şöyle söyleyim Gladiator filminin görüntü yönetmeninin adını ve hatta memleketini bile biliyoruz. İsmi Alexander Witt, memleketi de Çekya. 🙂

Sıkı durun hepsi de MSSQL datası olarak yapılandırıldı, normalizasyonları yapıldı ve ilişkileri tanımlandı.

Hepsi sizleri Alıştırmalarla SQL Öğreniyorum Kursu’nda uygulamalı olarak bekliyor.

Hadi hafta sonu fırsatın kaçırmayın. Sadece 27.99 TL.

https://www.udemy.com/course/alistirmalarla-sql-ogreniyorum/? couponCode=INDIRIMKASIM

Kupon kodu:INDIRIMKASIM

SQL Server’da Bir Database’i Page Seviyesinde Backup’tan Dönme

“Sql server detected a logical consistency-based i/o error” diye başlayan bir hatayla karşılaşmışsanız geçmiş olsun. Muhtemelen diskte bir sektör okuma hatası var. SQL Server’ın en küçük yapıtaşı olan 8 KB’lık page’lerden bir ya da birkaçı bozulmuş.
Koskoca milyon satırlık tabloda sadece 3-5 satır bozuk diye sorgunuz çalışmıyor. Tüm database i yedekten dönseniz yeni eklenen kayıtlar gidecek bu kez. Neyse ki kolay bir yolu var. Database’i page bazlı olarak yedekten dönebilme.
Yazdım. Beğenmeniz dileğiyle.

SQL Server Change Data Capture ile Değişiklik Yapılan Kayıtların Loglanması

Merhaba,

Bu makalemizde SQL Server tarafında yapılan maniplasyonların (Insert, Update, Delete) geri planda otomatik olarak kayıt altına alınmasını anlatıyor olacağız.

Şimdi bir senaryo düşünelim. Bir ticari yazılımımız var. Bu yazılımı dışarıdan satınaldık ve özelliklerine müdahele edemiyoruz kaynağı bizde olmadığı için.

Sistem üzerinde önemli bir fatura hareketinin değiştirildiğini ya da çıkarıldığını düşünelim. Son dönemlerdeki ticari yazılımlar bunların kayıt altına alınmasına izin veriyor ancak vermeyenler de var. Bu anlamda bizim database bazında bu kayıtların loglanmasına ihtiyacımız söz konusu.

Bu işlerle biraz uğraşanlar için ilk akla gelen tabiki trigger yazılması. Doğru bu bir çözümdür ancak sıkıntıları vardır.

Bu sıkıntılar genel olarak şöyledir;

  • Sizin yazdığınız trigger ticari programın kendisinin hata vermesine sebep olabilir ve kayıtların yapılmamasına sebep olabilir. Zira trigger lar transactionların bir parçasıdır ve trigger da gerçekleşen hata tüm transaction ı rollback  yapar.
  • Özellikle mevzuat değişimi gereği sıklıkla versiyon geçişi söz konusudur ve bu versiyon geçişlerinde database düzenlemesi yapıldığı için büyük ihtimal trigger larınız silinir ve her seferinde yeniden oluşturacak scriptler oluşturmanız gerekecektir.
  • Genel olarak Türkiye şartlarında dönem mali dönem bağımlı çalışmak tercih edildiği için her yıl başında fiziken yeni tablolar oluşturulmaktadır ve bunlar için de trigger lar yeniden yazılmalıdır.

Anlaşılacağı üzere trigger meselesi etkin bir çözümdür fakat biraz zahmetlidir.

Peki bizim yazımızın da konusu olan bu durum için bir çözüm yok mu? Birim fiyatı 5000 TL olan bir malzemenin satış faturasındaki fiyatını 50 TL olarak  değiştiren bir kişiyi tespit etmenin pratik bir yolu yok mudur?

Bu noktada imdadımıza SQL Server Change Data Capture (CDC) dediğimiz özellik yetişiyor. Bu arkadaş yetenekli bir arkadaş. SQL Server’da bildiğiniz üzere tüm manipülasyon işlemleri önce Log dosyasına sonra Data dosyasına yazılır.  Burada log dosyası diye bahsettiğim SQL server’ın sistem log dosyası değil database’in Log dosyasıdır (LDF).

İşte CDC sistem üzerinde Log dosyasını izler ve olan değişiklikleri hızlı bir şekilde kayıt altına alır.

Örnek olarak siz aşağıdaki gibi bir UPDATE cümlesi çalıştırdınız.

CUSTOMERS tablosunun 20 alandan oluştuğunu varsayalım oysa biz sadece bir alanı update ettik. Dolayısıyla SQL Server transaction log üzerinde sadece bir alanlık işlem hacmi söz konusu.

İşte Change Data Capture sadece bu bilgiyi okuyarak arka planda veriyi logluyor.

Siz  CDC yi configure ederken belli bir süreliğine dataları loglayıp belli bir tarihten öncesini sildirebiliyorsunuz. Burada yazacağınız bir script ile önce bu datalara herhangi bir warehouse ortamına alıp daha sonra sistemden temizleyebilirsiniz.

Öncelikle şunu başta belirtmek isterim ki bu özellik SQL Server 2008 den beri vardır ancak Enterprise edition üzerinde çalışır. Tabi test ortamları için developer edition da enterprise ın tüm özelliklerine sahiptir.

Şimdi bu CDC nasıl çalışıyor bir bakalım.

1. Önce bir tablo oluşturalım.

2.Database imizde CDC yi enable yapıyoruz.

3.Tablomuzda CDC yi enable yapalım.

CDC yi enable ettikten sonra system tables altında aşağıdaki tablolar oluşur.

  • cdc.captured_columns : Adından da anlaşılacağı üzere değişikliklerin takip edileceği kritik alanları tutar. Bu tablo manuel olarak edit edilebilir durumda olup içeriği değiştirilebilir.
  • cdc.change_tables :Hangi tabloların değişiminin takip edileceği bilgisini tutar.
  • cdc.ddl_history :Şema bilgilerindeki değişiklikleri tutar.
  • cdc.lsn_time_mapping: Asıl Tablo üzerinde yapılan her transaction işlemi bu tablo içerisinde tutulur ve içerisindeki lsn bilgisine göre hangi sırada yapıldığı bilgisi tutulur.

4.Şimdi bir kayıt ekleyelim.

5.UPDATE yapalım.

6.DELETE Yapalım

Görüldüğü gibi tablo üzerinde 2 insert,1 update ve 1 delete işlemi yaptık. Burada sistemde 4 satır kaydın logunun tutulması gerekiyor. Bakalım görebilecek miyiz?

Şimdi tablolarımıza bir bakalım.

CDC.captured_colums tablosu

CDC.ddl_history tablosu

CDC.index_column tablosu

CDC.lsn_time_mapping tablosu

Sistemde loglanan kayıtları ya doğrudan ya da tarih parametresi alan table valued function lar ile görebiliyoruz. Bu tablodaki kayıtlar ise log sequence number (lsn) ile tutuluyor. Bu fonksiyonlar da yine tablo bazlı olarak otomatik oluşuyor. Aşağıdaki resimde bu fonksiyonları görebilirsiniz.

Log kayıtlarını ulaşmak  istediğimizde  eğer tablonun tamamına ulaşmak istiyor isek

select

* from cdc.dbo_customers_CT şeklinde kullanıyoruz.

burada tablo formatı cdc.<schema>_<tablename>_CT şeklinde.

Bunun kullanımını sonucu aşağıdaki gibi.

table valued functionlar  ise aşağıdaki gibi kullanılıyor.

DECLARE @from_lsn binary(10), @to_lsn binary(10);

–minimum lsn numarasını buluyoruz.

SET @from_lsn = sys.fn_cdc_get_min_lsn(‘dbo_customers’);

–maximum lsn numarasını buluyoruz.

SET @to_lsn = sys.fn_cdc_get_max_lsn();

— CDC ile ilgili işlemlerde tablo bazlı oluşan cdc function larını kullanıyoruz.

SELECT * FROM cdc.fn_cdc_get_all_changes_dbo_customers(@from_lsn, @to_lsn, ‘all’);

Görüldüğü üzere sistem 4 adet fazladan alan ve sistemde yapılan değişiklik üzerine loglanan kayıtları getirdi.

Burada

__$start_lsn log: sequence number bilgisini içeriyor. Buradan kayıt tarihine erişebiliyoruz.

__$seqval: Sequnce değeri yani işlemin hangi sırada gerçekleştiği bilgisine erişmek için bu alan kullanılıyorç

__$operation:2 Insert, 4 Update ve 1 Delete için kullanılıyor.

__$operation:1 Insert,Delete 0 Update

anlamına gelmektedir.

Burada kayıt zamanını elde etmek istediğimizde

sys.fn_cdc_map_lsn_to_time function ını kullanıyoruz.

select sys.fn_cdc_map_lsn_to_time(__$start_lsn) as KayitZamani,

* from cdc.dbo_customers_CT

Burada oluşan log kayıtlarını temizlemek için ise

sp_cdc_cleanup_change_table

komutunu kullanıyoruz.

Kullanımı aşağıdaki gibi.


— aşağıdaki kod  3 gün öncesine ait logları temizliyor.
declare @lsn binary(10);
set @lsn = sys.fn_cdc_map_time_to_lsn(‘largest less than or equal’,getdate()-3);
exec sys.sp_cdc_cleanup_change_table @capture_instance = ‘dbo_Customers’, @low_water_mark=@lsn

–CDC yi disable etmek için ise 
sp_cdc_disable_db,
sp_cdc_disable_table 
komutları kullanlr 

EXECUTE sp_cdc_disable_table@source_schema = N’dbo’,@source_name = N’Customers’,@capture_instance =N’dbo_Customers’

CDC çalıştırabilmek için SQL Server agent a ihtiyacımız söz konusu.  Sistem 2 adet job ı otomatik olarak oluşturmaktadır. Bunlardan birisi değişen datanın capture edilmesini sağlarken diğeri de logları temizlemektedir.

Sonuç:

  • CDC gerçekten çok ihtiyaç duyulan ve çok kullanışlı bir araç.
  • Sistemdeki insert, update ve delete leri loglayabiliyor.
  • Eğer update cümlesinde kayıt değişmiyor ise gereksiz yer teşkil etmiyor.
  • Örneğin: UPDATE CUSTOMERS SET NAME=NAME cümlesini çalıştırdığımızda herhangi bir loglama yapmıyor çünkü değişen bir şey yok.
  • Sistemin çalışıyor olması için SQL Server Agent’ın mutlaka çalışması gerekir. Çünkü loğları okuyan bir job bu işleri yerine getirmektedir.
  • Yazacağımız bir script ile istediğimiz tablolarda çalıştırıp istemediklerimizde çalıştırmayabiliriz. Hatta çok fazla kolon olan bir tabloda istediğimiz kolonlar için aktif hale getirirken istemediklerimizi es geçebiliriz.

Bir sonraki makalede görüşmek üzere.

Veritabanı Uzmanı Olun.

Veritabanı Tasarımı yapabilen biri analitik düşünme kabiliyetine sahiptir.

Çapraz sorgular ile veriyi sorgulayabilen biri çözüm üretme becerisine sahiptir.

Bir veritabanı sistemini yönetmeyi bilen biri çalışan bir sistemin dilinden anlayan, sorun çözen, performans yönetimini iyi bilen biri demektir.

Hadi siz de Ağustos ayının son indiriminden faydalanarak,

Uygulamalarla SQL Öğreniyorum kursu ile SQL dilini öğrenin ve analitik düşünme yeteneğinizi daha da geliştirin.

https://www.udemy.com/course/sql-ogreniyorum/?couponCode=AGUSTOS3

Alıştırmalarla SQL Öğreniyorum kursu ile SQL sorguları ile veriyi analiz etmeyi ve sözel sorulara veri ile cevap vermeyi öğrenin.

https://www.udemy.com/course/alistirmalarla-sql-ogreniyorum/?couponCode=AGUSTOS3

Uçtan Uca SQL Server kursu ile bir veritabanı yönetim sistemini uçtan uca yönetmeyi öğrenin.

https://www.udemy.com/course/uctan-uca-sql-server-egitimi/?couponCode=AGUSTOS3

Tüm kurslar 24.99 TL

Kupon kodu:AGUSTOS3