Bir veri analisti olarak, genellikle birden çok veri kümesini birleştirme ihtiyacıyla karşılaşırsınız. Analizinizi tamamlamak ve işletmeniz/paydaşlarınız için bir sonuca varmak için bunu yapmanız gerekecek.

Python'un pandas Kitaplığı Tarafından Sunulan 4 DataFrame Birleştirme Türü

Farklı tablolarda saklanan verileri temsil etmek genellikle zordur. Bu gibi durumlarda, üzerinde çalıştığınız programlama dilinden bağımsız olarak birleştirmeler değerlerini kanıtlar.

Python birleştirmeleri, SQL birleştirmelerine benzer: veri kümelerini, satırlarını ortak bir dizin üzerinde eşleştirerek birleştirir.

Referans İçin İki DataFrame Oluşturun

Bu kılavuzdaki örnekleri takip etmek için iki örnek DataFrame oluşturabilirsiniz. Bir kimlik, ad ve soyadı içeren ilk DataFrame’i oluşturmak için aşağıdaki kodu kullanın.

import pandas as pd

a = pd.DataFrame({“ID”: [“001”, “002”, “003”, “004”, “005”],

“Fname”: [“Ron”, “John”, “Helen”, “Jenny”, “Kenny”],

“Lname”: [“Keith”, “Harley”, “Smith”, “Kerr-Hislop”, “Barber”]})

print(a)

İlk adım için pandalar kitaplığını içe aktarın. Ardından , DataFrame yapıcısından sonucu depolamak için a değişkenini kullanabilirsiniz . Yapıcıya gerekli değerlerinizi içeren bir sözlük iletin.

Son olarak, her şeyin beklediğiniz gibi göründüğünü kontrol etmek için DataFrame değerinin içeriğini print işleviyle görüntüleyin.

Benzer şekilde, kimlik ve maaş değerleri içeren başka bir DataFrame, b oluşturabilirsiniz.

b = pd.DataFrame({“ID”: [“001”, “002”, “003”, “004”, “005”],

“Salary”: [100000, 700000, 80000, 904750, 604772]})

print(b)

Çıktıyı bir konsolda veya bir IDE’de kontrol edebilirsiniz. DataFrame’lerinizin içeriğini doğrulamalıdır:

Birleştirmeler Python’daki Birleştirme İşlevinden Nasıl Farklıdır?

Pandalar kitaplığı, DataFrame’leri işlemek için kullanabileceğiniz ana kitaplıklardan biridir. DataFrame’ler birden çok veri kümesi içerdiğinden Python’da bunları birleştirmek için çeşitli işlevler mevcuttur.

Python, DataFrame’leri birleştirmek için kullanabileceğiniz birleştirme ve birleştirme işlevlerini sunar. Bu iki işlev arasında, herhangi birini kullanmadan önce aklınızda bulundurmanız gereken çok büyük bir fark vardır.

Birleştirme işlevi, indeks değerlerine göre iki DataFrame’i birleştirir. Birleştirme işlevi , dizin değerlerine ve sütunlara dayalı olarak DataFrame’leri birleştirir .

Python’da Birleştirmeler Hakkında Bilmeniz Gerekenler Nelerdir?

Mevcut birleştirme türlerini tartışmadan önce, dikkat edilmesi gereken bazı önemli noktalar şunlardır:

SQL birleştirmeleri en temel işlevlerden biridir ve Python’un birleştirmelerine oldukça benzer.

DataFrame’lere katılmak için pandas.DataFrame.join() yöntemini kullanabilirsiniz.

Varsayılan birleştirme sol birleştirme gerçekleştirirken birleştirme işlevi bir iç birleştirme gerçekleştirir.

Python birleştirme için varsayılan sözdizimi aşağıdaki gibidir:

DataFrame.join(other, on=None, how=’left/right/inner/outer’, lsuffix=”, rsuffix=”,

sort=False)

İlk DataFrame’de birleştirme yöntemini çağırın ve ikinci DataFrame’i ilk parametresi olarak iletin, other . Kalan argümanlar şunlardır:

on , birden fazla varsa, katılmak için bir dizini adlandırır.

how iç, dış, sol ve sağ dahil olmak üzere birleştirme türünü tanımlar .

lsuffix , sütun adınızın sol sonek dizesini tanımlar.

sütun adınızın doğru sonek dizesini tanımlayan rsuffix .

sort , sonuçta ortaya çıkan DataFrame öğesinin sıralanıp sıralanmayacağını belirten bir boole değeridir.

Python’da Çeşitli Birleştirme Türlerini Kullanmayı Öğrenin

Python, saatin ihtiyacına göre kullanabileceğiniz birkaç birleştirme seçeneğine sahiptir. İşte birleştirme türleri:

1. Sol Birleştirme

Sol birleştirme, ikinci DataFrame’den eşleşen değerleri getirirken ilk DataFrame’in değerlerini olduğu gibi tutar. Örneğin, b öğesinden eşleşen değerleri getirmek istiyorsanız , bunu aşağıdaki gibi tanımlayabilirsiniz:

c = a.join(b, how=”left”, lsuffix = “_left”, rsuffix = “_right”, sort = True)

print(c)

Sorgu yürütüldüğünde, çıktı aşağıdaki sütun referanslarını içerir:

kimlik_sol

Soyadı

İsim

ID_right

Aylık maaş

Bu birleştirme, ilk DataFrame’den ilk üç sütunu ve ikinci DataFrame’den son iki sütunu çeker. Elde edilen alan adlarının benzersiz olmasını sağlamak için her iki veri kümesindeki kimlik sütunlarını yeniden adlandırmak için lsuffix ve rsuffix değerlerini kullandı.

Çıktı aşağıdaki gibidir:

Python’un veri çerçevelerinde sol birleştirme gösteren kod

2. Sağ Katılma

Doğru birleştirme, ilk tablodan eşleşen değerleri getirirken ikinci DataFrame’in değerlerini olduğu gibi tutar. Örneğin, a öğesinden eşleşen değerleri getirmek istiyorsanız , bunu aşağıdaki gibi tanımlayabilirsiniz:

c = b.join(a, how=”right”, lsuffix = “_right”, rsuffix = “_left”, sort = True)

print(c)

Çıktı aşağıdaki gibidir:

Python’un veri çerçevelerinde sağ birleştirmeyi gösteren kod

Kodu incelerseniz, birkaç belirgin değişiklik vardır. Örneğin, sonuç, birinci DataFrame’den önce ikinci DataFrame’in sütunlarını içerir.

Bir sağ birleşim belirtmek için how bağımsız değişkeni için bir right değeri kullanmalısınız . Ayrıca, sağ birleştirmenin doğasını yansıtmak için lsonfix ve rsuffix değerlerini nasıl değiştirebileceğinize dikkat edin .

Normal birleştirmelerinizde, sağ birleştirmeye kıyasla kendinizi sol, iç ve dış birleştirmeleri daha sık kullanırken bulabilirsiniz. Ancak, kullanım tamamen veri gereksinimlerinize bağlıdır.

3. İç Birleştirme

Bir iç birleştirme, eşleşen girişleri her iki DataFrame’den teslim eder. Birleştirmeler, satırları eşleştirmek için dizin numaralarını kullandığından, bir iç birleştirme yalnızca eşleşen satırları döndürür. Bu çizim için, aşağıdaki iki DataFrame’i kullanalım:

a = pd.DataFrame({“ID”: [“001”, “002”, “003”, “004”, “005”, “006”, “007”],

“Fname”: [“Ron”, “John”, “Helen”, “Jenny”, “Kenny”, “Daryl”, “Cathy”],

“Lname”: [“Keith”, “Harley”, “Smith”, “Kerr-Hislop”, “Barber”, “Hooper”, “Hope”]})

b = pd.DataFrame({“ID”: [“001”, “002”, “003”, “004”, “005”],

“Salary”: [100000, 700000, 80000, 904750, 604772]})

print(a)

print(b)

Çıktı aşağıdaki gibidir:

Python’da yeni veri çerçeveleri oluşturun

Bir iç birleştirmeyi aşağıdaki gibi kullanabilirsiniz:

c = a.join(b, lsuffix=”_left”, rsuffix=”_right”, how=’inner’)

print(c)

Ortaya çıkan çıktı, yalnızca her iki giriş DataFrame’inde bulunan satırları içerir:

Python’un veri çerçevelerinde iç birleşimi gösteren kod

4. Dış Birleştirme

Bir dış birleştirme, her iki DataFrame’den de tüm değerleri döndürür. Eşleşen değerleri olmayan satırlar için, tek tek hücrelerde bir boş değer üretir.

Yukarıdakiyle aynı DataFrame’i kullanarak, işte dış birleştirme kodu:

c = a.join(b, lsuffix=”_left”, rsuffix=”_right”, how=’outer’)

print(c)

Python’un veri çerçevelerinde dış birleştirmeyi gösteren kod

Python’da Birleştirmeleri Kullanma

Eşdeğer işlevleri olan birleştirme ve birleştirme gibi birleştirmeler, basit bir birleştirme işlevinden çok daha fazlasını sunar. Bir dizi seçenek ve işlev göz önüne alındığında, gereksinimlerinizi karşılayan seçenekleri seçebilirsiniz.

Python’un sunduğu esnek seçeneklerle, birleştirme işlevi olsun veya olmasın, ortaya çıkan veri kümelerini nispeten kolay bir şekilde sıralayabilirsiniz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir