DB tốt nhất cho Python là gì?

Bạn có tin không, thời điểm bạn cài đặt Python trên máy tính của mình, bạn cũng đã cài đặt các công cụ tuyệt vời khác. Một trong số đó là SQLite

SQLite là một hệ thống quản lý cơ sở dữ liệu quan hệ dựa trên tệp [RDBMS] nhúng, có thể được sử dụng trong các ứng dụng Python của chúng tôi mà không phải cài đặt bất kỳ phần mềm bổ sung nào. Thay vào đó, chúng ta chỉ cần nhập thư viện Python có sẵn

c = conn.cursor[]
3 để sử dụng cơ sở dữ liệu này

Trong hướng dẫn này, chúng ta sẽ xem cách kết nối với cơ sở dữ liệu, tạo bảng, chèn dữ liệu vào bảng và cách tích hợp nó với Pandas

Nếu bạn không muốn đọc, bạn có thể xem video YouTube của tôi để thay thế

Hãy nhớ đăng ký tại đây để nhận Bảng cheat SQL mà tôi sử dụng trong tất cả các hướng dẫn của mình [PDF miễn phí]

Tạo kết nối đến cơ sở dữ liệu

Điều đầu tiên chúng ta phải làm là tạo kết nối đến cơ sở dữ liệu. Để làm như vậy, chúng ta chỉ cần nhập sqlite3 và sử dụng phương thức

c = conn.cursor[]
4. Trong dấu ngoặc đơn, chúng tôi viết tên của cơ sở dữ liệu mà chúng tôi muốn tạo. Trong trường hợp của tôi, tôi sẽ gọi nó là “sinh viên. db”

import sqlite3

# create a connection
conn = sqlite3.connect['students.db']

Nếu bạn chạy đoạn mã trên, một tệp mới có tên “students. db” sẽ được tạo trong thư mục làm việc của bạn

Hình ảnh của tác giả

Bây giờ chúng ta có thể tạo một bảng và đưa dữ liệu vào đó

Tạo một bảng

Trước khi tạo bảng ta cần tạo con trỏ. Con trỏ là một đối tượng được sử dụng để tạo kết nối để thực hiện các truy vấn SQL. Chúng tôi sẽ sử dụng con trỏ để tạo bảng, chèn dữ liệu, v.v.

Để tạo con trỏ, chúng ta chỉ cần sử dụng kết nối mà chúng ta đã tạo và phương thức

c = conn.cursor[]
5

c = conn.cursor[]

Sau đó, chúng ta sử dụng phương thức

c = conn.cursor[]
6 để tạo một bảng mới trong cơ sở dữ liệu của mình. Bên trong dấu ngoặc kép, chúng tôi viết cú pháp SQL trung bình được sử dụng để tạo bảng trong hầu hết các RDBMS. Trong trường hợp này, chúng tôi sử dụng câu lệnh
c = conn.cursor[]
7

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]

Như bạn có thể thấy, chúng ta cần xác định kiểu dữ liệu khi tạo các cột của bảng. Không giống như hầu hết các RDBMS có hàng chục loại dữ liệu, SQLite chỉ có 5 loại dữ liệu

  • Vô giá trị. Giá trị còn thiếu
  • số nguyên. Số không có dấu thập phân [e. g. , 1, 2, 3, 4]
  • Thực. Các số có dấu thập phân [e. g. , 6. 2, 7. 6, 11. 2]
  • Chữ. Dữ liệu ký tự bất kỳ
  • Bãi. Tập hợp dữ liệu nhị phân được lưu trữ dưới dạng giá trị trong cơ sở dữ liệu. Nó cho phép chúng tôi lưu trữ tài liệu, hình ảnh và các tệp đa phương tiện khác trong cơ sở dữ liệu

Cuối cùng, chúng ta phải cam kết và đóng kết nối. Đây là cách mã trông cho đến nay

Tuyệt quá. Chúng tôi đã tạo bảng đầu tiên của mình, nhưng nó trống, vì vậy hãy thêm một số dữ liệu vào đó

Chèn dữ liệu vào bảng

Hãy bắt đầu bằng cách thêm một hàng vào bảng "sinh viên" của chúng tôi. Để làm như vậy, chúng tôi sử dụng lại

c = conn.cursor[]
6, nhưng bây giờ chúng tôi sử dụng câu lệnh
c = conn.cursor[]
9

Dưới đây tôi thêm dữ liệu về một học sinh “đánh dấu” 20 tuổi và là 1. 9 mét

c = conn.cursor[]
0

Lưu ý trước khi chạy đoạn code trên bạn cần comment câu lệnh

c = conn.cursor[]
7 vì bảng đã tồn tại

Chúng tôi cũng có thể chèn nhiều hàng, nhưng trong trường hợp này, chúng tôi sử dụng phương thức

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
1. Ngoài ra, chúng tôi sử dụng
c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
2 làm trình giữ chỗ. Điều này giúp chúng tôi thêm dữ liệu từ danh sách mà chúng tôi đặt tên là
c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
3

c = conn.cursor[]
5

Chọn dữ liệu từ một bảng và hiển thị dữ liệu

Cho đến giờ chúng ta đã tạo một bảng và đưa dữ liệu vào đó, nhưng chúng ta vẫn chưa nhìn thấy bảng của mình. Để xem dữ liệu của chúng tôi, trước tiên chúng tôi cần chọn dữ liệu từ bảng của chúng tôi với câu lệnh

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
4 và sau đó hiển thị nó với
c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
5

c = conn.cursor[]
8

Đầu ra được in phải là

c = conn.cursor[]
9

Trong trường hợp bạn không muốn lặp lại các bước này mỗi lần muốn xem dữ liệu trong bảng, bạn có thể sử dụng SQLiteViewer. Ở đó bạn chỉ cần kéo. db để xem nội dung của nó

Hình ảnh của tác giả

Đây là tất cả những gì chúng tôi đã làm cho đến nay

Đó là nền tảng của SQLite trong Python. Những việc như cập nhật hàng, xóa hàng, sắp xếp dữ liệu và xóa bảng cũng có thể thực hiện được trong SQLite. Bạn chỉ cần sử dụng kiến ​​thức SQL của mình để thực hiện chúng

Làm việc với Pandas và SQLite

SQLite có thể tích hợp với các khung dữ liệu trong Pandas. Ví dụ: chúng tôi sẽ làm việc với tệp CSV có tên là

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
6 mà bạn có thể tải xuống tại đây

import sqlite3

# create a connection
conn = sqlite3.connect['students.db']
1

Đây là giao diện của khung dữ liệu

import sqlite3

# create a connection
conn = sqlite3.connect['students.db']
2

Bây giờ hãy tạo một cơ sở dữ liệu SQLite trong bộ nhớ. Để làm như vậy, trước tiên, chúng ta cần cài đặt sqlalchemy.

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
7

Sau đó, chúng ta cần tạo một động cơ

import sqlite3

# create a connection
conn = sqlite3.connect['students.db']
4

Bây giờ, hãy đính kèm khung dữ liệu vào một bảng trong cơ sở dữ liệu của chúng ta [bảng không cần tạo trước]. Trong trường hợp này, tôi sẽ đính kèm

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
8 vào bảng mà tôi đặt tên là "dân số"

c = conn.cursor[]
0

Để xem bảng của chúng tôi, chúng tôi chạy mã dưới đây

c = conn.cursor[]
1

Ghi chú. Nếu bạn muốn tạo một tệp sqlite [thay vì cơ sở dữ liệu trong bộ nhớ], bạn nên tạo một công cụ có cơ sở dữ liệu tệp

Hãy tạo một tệp

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
9 và sau đó đính kèm khung dữ liệu
c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
8 vào bảng "dân số"

c = conn.cursor[]
2

Một lần nữa, bạn có thể sử dụng

c.execute["""CREATE TABLE students [
name TEXT,
age INTEGER,
height REAL
]"""]
5 để xem bảng hoặc sử dụng Trình xem SQLite

Xin chúc mừng. Bây giờ bạn đã biết cách làm việc với SQLite trong Python và thậm chí tích hợp nó với các khung dữ liệu trong Pandas

Tìm hiểu SQL - kỹ năng được yêu cầu nhiều nhất cho các chuyên gia dữ liệu. Nhận Bảng cheat SQL MIỄN PHÍ của tôi bằng cách tham gia danh sách email của tôi với hơn 20 nghìn người

Nếu bạn thích đọc những câu chuyện như thế này và muốn hỗ trợ tôi với tư cách là một nhà văn, hãy cân nhắc đăng ký để trở thành thành viên Medium. Đó là 5 đô la một tháng, cho phép bạn truy cập không giới hạn vào hàng nghìn hướng dẫn về Python và các bài báo về Khoa học dữ liệu. Nếu bạn đăng ký bằng liên kết của tôi, tôi sẽ kiếm được một khoản hoa hồng nhỏ mà bạn không phải trả thêm phí

Cơ sở dữ liệu nào chúng ta có thể sử dụng với Python?

Python hỗ trợ nhiều cơ sở dữ liệu khác nhau như SQLite, MySQL, Oracle, Sybase, PostgreSQL , v.v. Python cũng hỗ trợ Ngôn ngữ Định nghĩa Dữ liệu [DDL], Ngôn ngữ Thao tác Dữ liệu [DML] và Câu lệnh Truy vấn Dữ liệu. Tiêu chuẩn Python cho giao diện cơ sở dữ liệu là Python DB-API.

MySQL có tốt cho Python không?

Máy chủ MySQL sẽ cung cấp tất cả các dịch vụ cần thiết để xử lý cơ sở dữ liệu của bạn. Sau khi máy chủ được thiết lập và chạy, bạn có thể kết nối ứng dụng Python của mình với nó bằng Trình kết nối MySQL/Python .

DB tốt nhất để sử dụng là gì?

10 cơ sở dữ liệu quan hệ hàng đầu .
MSSQL
Cơ sở dữ liệu Oracle
Dịch vụ cơ sở dữ liệu quan hệ của Amazon [RDS]
mysql
Đám mây SAP HANA
IBM Db2
PostgreSQL
Cơ sở dữ liệu Azure SQL

SQL có tốt với Python không?

Các nhà khoa học dữ liệu sử dụng SQL trong Python trong nhiều trường hợp khác nhau, được quyết định bởi trường hợp sử dụng hiện tại hoặc theo sở thích cá nhân. SQL chủ yếu được sử dụng để sắp xếp dữ liệu, đặc biệt là trong các truy vấn đào tạo, cũng như để phân tích đặc biệt các kết quả của mô hình .

Chủ Đề