En basit görevler için bile Python kullanıyorsanız, muhtemelen üçüncü taraf kitaplıklarının öneminin farkındasınızdır. DataFrames için mükemmel desteği olan Pandas kitaplığı böyle bir kitaplıktır.

Python'da Veri Çerçevelerini Nasıl Birleştireceğinizi Öğrenin

Birden çok dosya türünü Python DataFrames’e aktarabilir ve farklı veri kümelerini depolamak için çeşitli sürümler oluşturabilirsiniz. DataFrame’leri kullanarak verilerinizi içe aktardıktan sonra, ayrıntılı analiz yapmak için bunları birleştirebilirsiniz.

Temelleri Ele Alma

Birleştirmeye başlamadan önce, birleştirilecek DataFrame’lere sahip olmanız gerekir. Geliştirme amacıyla, deneme yapmak için bazı sahte veriler oluşturabilirsiniz.

Python’da DataFrame’leri oluşturun

İlk adım olarak Pandas kitaplığını Python dosyanıza aktarın. Pandas, Python’da DataFrame’leri işleyen bir üçüncü taraf kitaplığıdır. Kitaplığı kullanmak için import deyimini aşağıdaki gibi kullanabilirsiniz:

import pandas as pd

Kod başvurularınızı kısaltmak için kitaplık adına bir diğer ad atayabilirsiniz.

DataFrames’e dönüştürebileceğiniz sözlükler oluşturmanız gerekir. En iyi sonuçlar için, belirli bilgi parçalarını depolamak üzere iki sözlük değişkeni (dict1 ve dict2 ) oluşturun:

dict1 = {“user_id”: [“001”, “002”, “003”, “004”, “005”],

“FName”: [“John”, “Brad”, “Ron”, “Roald”, “Chris”],

“LName”: [“Harley”, “Cohen”, “Dahl”, “Harrington”, “Kerr-Hislop”]}

dict2 = {“user_id”: [“001”, “002”, “003”, “004”], “Age”: [15, 28, 34, 24]}

DataFrame’lerinizi daha sonra birleştirmek için birincil anahtar görevi görmesi için her iki sözlük değerinde ortak bir öğeye sahip olmanız gerektiğini unutmayın.

Sözlüklerinizi DataFrame’lere Dönüştürün

Sözlük değerlerinizi DataFrame’lere dönüştürmek için aşağıdaki yöntemi kullanabilirsiniz:

df1 = pd.DataFrame(dict1)

df2 = pd.DataFrame(dict2)

Bazı IDE’ler, DataFrame işlevine başvurarak ve Run/Execute düğmesine basarak DataFrame içindeki değerleri kontrol etmenizi sağlar . Pek çok Python uyumlu IDE vardır , böylece sizin için öğrenmesi en kolay olanı seçip seçebilirsiniz.

Jupyter Notebook kod parçacığı

DataFrame’lerinizin içeriğinden memnun olduğunuzda, birleştirme adımına geçebilirsiniz.

Çerçeveleri Birleştirme İşleviyle Birleştirme

Birleştirme işlevi, iki DataFrame’i birleştirmek için kullanabileceğiniz ilk Python işlevidir. Bu işlev aşağıdaki varsayılan bağımsız değişkenleri alır:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

Neresi:

pd , Pandas kitaplığı için bir takma addır.

birleştirme , DataFrames’i birleştiren işlevdir.

DataFrame1 ve DataFrame2 , birleştirilecek iki DataFrame’dir.

birleştirme türünü nasıl tanımlar.

Karmaşık bir veri yapınız olduğunda kullanabileceğiniz bazı ekstra isteğe bağlı bağımsız değişkenler mevcuttur.

Gerçekleştirilecek birleştirme türünü tanımlamak için how parametresi için farklı değerler kullanabilirsiniz. Veritabanı tablolarını birleştirmek için SQL kullandıysanız , bu tür birleştirmelere aşina olacaksınız .

Sol Birleştirme

Sol birleştirme türü, ilk DataFrame’in değerlerini olduğu gibi tutar ve eşleşen değerleri ikinci DataFrame’den çeker.

Jupyter Notebook kod parçacığı

Sağ Birleştirme

Doğru birleştirme türü, ikinci DataFrame’in değerlerini olduğu gibi tutar ve eşleşen değerleri ilk DataFrame’den çeker.

Jupyter Notebook kod parçacığı

İç Birleştirme

İç birleştirme türü, her iki DataFrame’deki eşleşen değerleri korur ve eşleşmeyen değerleri kaldırır.

Jupyter Notebook kod parçacığı

Dış Birleştirme

Dış birleştirme türü, eşleşen ve eşleşmeyen tüm değerleri korur ve DataFrame’leri bir arada birleştirir.

Jupyter Notebook kod parçacığı

Concat İşlevi Nasıl Kullanılır?

Python'da Veri Çerçevelerini Nasıl Birleştireceğinizi Öğrenin

concat işlevi , Python’un diğer bazı birleştirme işlevlerine kıyasla esnek bir seçenektir. concat fonksiyonu ile DataFrame’leri dikey ve yatay olarak birleştirebilirsiniz.

Ancak, bu işlevi kullanmanın dezavantajı, eşleşmeyen değerleri varsayılan olarak atmasıdır. Diğer ilgili işlevler gibi, bu işlevin de başarılı bir birleştirme için yalnızca birkaç tanesinin gerekli olduğu birkaç bağımsız değişkeni vardır.

concat(dataframes, axis=0, join=’outer’/’inner’)

Neresi:

concat , DataFrames’i birleştiren işlevdir.

dataframes , birleştirilecek bir DataFrame dizisidir.

eksen birleştirme yönünü temsil eder, 0 yatay, 1 dikeydir.

birleştirme , bir dış veya iç birleşimi belirtir.

Yukarıdaki iki DataFrame’i kullanarak, concat işlevini aşağıdaki gibi deneyebilirsiniz:

# define the dataframes in a list format

df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function

print(df_merged_concat)

Yukarıdaki kodda eksen ve birleştirme bağımsız değişkenlerinin olmaması, iki veri kümesini birleştirir. Ortaya çıkan çıktı, eşleşme durumundan bağımsız olarak tüm girişlere sahiptir.

Benzer şekilde, concat işlevinin yönünü ve çıktısını denetlemek için ek bağımsız değişkenler kullanabilirsiniz.

Çıktıyı tüm eşleşen girişlerle kontrol etmek için:

# Concatenating all matching values between the two dataframes based on their columns

df_merged_concat = pd.concat([df1, df2], axis=1, join = ‘inner’)

print(df_merged_concat)

Sonuç, yalnızca iki DataFrame arasındaki tüm eşleşen değerleri içerir.

Jupyter Notebook kod parçacığı

DataFrame’leri Python ile Birleştirme

DataFrame’ler, esneklikleri ve işlevleri dikkate alındığında Python’un ayrılmaz bir parçasıdır. Çok yönlü kullanımları göz önüne alındığında, çeşitli görevleri son derece kolaylıkla gerçekleştirmek için kapsamlı bir şekilde kullanabilirsiniz.

Hâlâ Python DataFrames hakkında bilgi alıyorsanız, bazı Excel dosyalarını içe aktarmayı deneyin ve ardından bunları farklı yaklaşımlarla birleştirin.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir