Và điều đó có vẻ đúng với tôi theo mọi nghĩa của thế giới. Không có tệp đó, việc tạo các mô hình và đưa ra các giả thuyết khác nhau sẽ hoàn thành tốt hơn nhiều, vai trò của khai thác dữ liệu không thể bị đánh giá thấp.
Và với sự phổ biến của tất cả mọi người khi nói đến et al và các nhiệm vụ chuẩn bị dữ liệu, mọi người nên biết một chút danh sách đó rất hữu ích.
Tôi vẫn nhớ lần đầu tiên tôi chạm tay vào mọi thứ. Đã học bằng ngôn ngữ đầu tiên của bạn [Nếu bạn có thể gọi nó như vậy]. Và nó đã tạo ra một tác động và có thể. E có khả năng vượt qua mọi thứ, và đó là điều mà tôi chưa từng nghĩ đến trước đây
Trước hết, hãy làm việc với Excel — Volumes và Pivots. E đang tạo hệ thống báo cáo, ding ti song làm đi làm lại. Tất cả đã làm nên tất cả c go. Giờ đây, nó là một tập lệnh lớn đang hoạt động và mọi thứ đều được xây dựng hoặc tự động hóa — tất cả các tab chéo và phân tích được tạo ra một cách nhanh chóng.
tức là 2 tắt nguồn tất cả. Và bạn có gọi bất cứ thứ gì mà bạn sử dụng gấu trúc không, bạn cần phải học tất cả để đối phó với các hệ thống sẽ thích, tradata và đôi khi cả spark nữa
Bài đăng này là về cài đặt mọi thứ, giải thích mọi thứ và chạy mọi thứ
Cài đặt nằm trong Tất cả các môi trường
Bây giờ cách tốt nhất để học là bắt tay vào làm.
Tôi sẽ phản đối việc sử dụng các công thức dựa trên web như trường học/hướng dẫn của chúng tôiSpint cho tất cả vì bạn không thể sử dụng dữ liệu của mình với những công thức đó
Ngoài ra, tôi sẽ khuyên bạn nên tìm hiểu hương vị MySQL của SQL vì nó là Nguồn mở, dễ cài đặt trong máy tính xách tay của bạn và có một ứng dụng khách tuyệt vời tên là MySQL Workbench để giúp cuộc sống của bạn dễ dàng hơn.
sbey have gotan teshe point out of da way, hare 2 a step by step để thiết lập với miscol
- Bạn có thể tải xuống Miscall cho hệ thống cụ thể của mình [Mac OSX, Linux, Windows] từ máy chủ cộng đồng Tải xuống Miscall. Trong trường hợp của tôi, tôi đã tải xuống kho lưu trữ. Sau đó, nhấp đúp chuột và cài đặt tệp. Bạn có thể cần phải thiết lập một mật khẩu. Hãy nhớ mật khẩu này là bắt buộc để kết nối với phiên bản sai sau này.
- Tạo một tệp có tên _______0_______0 và đặt phần sau vào đó. Chỉ cần 2 để cấp quyền đọc tệp cục bộ cho toàn bộ cơ sở dữ liệu của bạn
[client]
port= 3306
[mysqld]
port= 3306
secure_file_priv=''
local-infile=1
- Mở phụ
SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
1. C đến
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
2 và duyệt đến tệp
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
0 bằng nút chọn
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;
- Khởi động lại máy chủ từ tab
SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
4 b nhấp vào dừng và bắt đầu
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;
- Khi bạn chạy máy chủ, hãy tải xuống và cài đặt MySQL Workbench. Tải xuống bàn làm việc Miskol. Workbench cung cấp cho bạn một trình chỉnh sửa để thực hiện tất cả công việc của bạn và nhận kết quả theo cách có cấu trúc.
- Mở T Miskel Workbench ngay bây giờ và kết nối với tất cả thông qua nó. Bạn cũng sẽ nói điều gì đó giống như Bell
- Bạn có thể đặt kết nối cá thể cục bộ mà không cần thiết lập tùy chọn của mình. Bây giờ, bạn chỉ cần nhấp vào kết nối đó và bắt đầu sử dụng mật khẩu mà chúng tôi đã thiết lập trước đó cho máy chủ MySQL [Bạn cũng có thể tạo kết nối đến máy chủ SQL hiện có mà có thể không có trên máy của bạn nếu bạn có địa chỉ, số cổng, tên người dùng và mật khẩu]
- Và bạn vào trình chỉnh sửa để tìm thông tin chính xác của mình trên cơ sở dữ liệu cụ thể
- Kiểm tra tab
SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
5 và phía trên bên trái của tab đó hiện diện. Có 2 chỉ là một lược đồ
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
6 hiện diện với bảng
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
7. Lưu ý n nguồn dữ liệu thú vị để tìm hiểu tất cả. Vì vậy, hãy cài đặt một số dữ liệu để thực hành
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC; - Nếu bạn có dữ liệu của riêng mình để làm việc. Sau đó tốt và tốt. Bạn có thể tạo một lược đồ [cơ sở dữ liệu] mới và tải nó lên Tables bằng các lệnh sau. [Bạn có thể chạy các lệnh bằng cách sử dụng
SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
8 hoặc bằng cách nhấp vào nút ⚡️tia chớp]
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC;
Trong hướng dẫn này, tôi sẽ sử dụng Cơ sở dữ liệu phim Sakila mà bạn có thể cài đặt bằng các bước sau.
- c vào tài liệu miscol và tải xuống tệp zip t sakila
- giải nén tập tin t
- Bây giờ, hãy truy cập Miskol Workbench và chọn Tệp>Chạy tất cả tập lệnh>Chọn vị trí
SELECT col1, SUM[col2] as col2sum, AVG[col3] as col3avg
9
FROM table_name
WHERE col4 = 'some_value'
GROUP BY col1
ORDER BY col2sum DESC; - Chuyển đến Bàn làm việc khác và chọn Tệp > Chạy tất cả tập lệnh > Chọn vị trí ________ga_______0
Khi bạn nhập, bạn sẽ thấy một cơ sở dữ liệu mới được thêm vào danh sách lược đồ
Chơi với dữ liệu
Bây giờ có một số dữ liệu với chúng tôi. đêm chung kết
Hãy bắt đầu với việc viết somme karis
Bạn có thể cố gắng hiểu chi tiết lược đồ của cơ sở dữ liệu Saqila bằng cách sử dụng tài liệu cơ sở dữ liệu mẫu Saqila.
sơ đồ lược đồ
Bây giờ là cú pháp cơ bản của tất cả các truy vấn khác 2
_______0_______Có bốn yếu tố trong truy vấn này
- lựa chọn. Lựa chọn chung nào? . Ơi cũng đặt tên mới cho ________ga_______4 b dùng từ khóa t ________ga_______5 đi. Chính xác 2 bí danh Kanyon S
- từ. Nên chọn bảng nào?
- đây. Chúng ta có thể lọc dữ liệu bằng cách sử dụng câu lệnh where
- nhóm B. TẤT CẢ CÁC LỆNH HOẶC LƯU Ý ĐƯỢC CHỌN TRONG TỔNG HỢP ĐÃ BÁN BAY TRONG NHÓM B
- Đặt hàng B. Ngắn và ________ga_______6
Truy vấn trên sẽ giúp bạn với hầu hết những điều đơn giản mà bạn muốn tìm trong cơ sở dữ liệu.
Ví dụ: chúng ta có thể tìm hiểu xem các bộ phim được xếp hạng kiểm duyệt khác nhau được xem khác nhau như thế nào.
________ga_______bài tập. Đúc tại khung
Bây giờ bạn nên đưa ra một số chi phí của riêng bạn
Ví dụ: bạn có thể thử tìm tất cả các phim đã phát hành trong năm 2006. Cố gắng tìm tất cả các bộ phim có xếp hạng 10 và thời lượng lớn hơn 50 phút.
Bạn có thể cái này đang chạy t sau trên bàn làm việc miscol
________đến_______tất cả trong quần jean
Cho đến bây giờ, Be đã học được cách Be có thể làm việc với các bảng đơn. Nhưng trong thực tế, chúng ta cần phải làm việc với nhiều bảng
Vì vậy, điều tiếp theo bạn muốn học là cách may quần jean
Bây giờ Genes RN Phần tích hợp và thiết yếu của cơ sở dữ liệu Miscol và hiểu chủ đề 2 cần thiết. t chuông cũng telex trực quan về hầu hết: t vị trí tình dục tồn tại trong tất cả. Mặc định trở lên chỉ sử dụng phép nối bên trái và phép nối bên trong, do đó, nó cho biết bắt đầu bằng phép nối bên trái.
T LEFT JOIN được sử dụng khi bạn muốn giữ tất cả các bản ghi trong [các] bảng T LEFT và hợp nhất hoặc chỉ các bản ghi phù hợp. t bản ghi của một ghi chú ohere bis hợp nhất ore giữ s null trong bảng t kết quả. T Miscol Cú pháp 2
SELECT A.col1, A.col2, B.col3, B.col4
FROM A
LEFT JOIN B
ON A.col2=B.col3
Sau đó chọn col1 và col2 từ bảng a và col3 và col4 từ bảng hoặc. Cũng cụ thể những điểm chung nào để tham gia và sử dụng tuyên bố Ong đó
Nối bên trong được sử dụng khi bạn muốn hợp nhất A và B và chỉ để giữ các bản ghi chung trong A và B.
ví dụ
Vì vậy, hãy cho bạn biết trường hợp sử dụng, hãy quay lại cơ sở dữ liệu Shakila của chúng tôi. HÃY CỨ MUỐN TÌM HIỂU CÓ BAO NHIÊU BẢN PHIM YACHY TRONG KHO CỦA CHÚNG TÔI. Bạn có thể nhận B ngay lập tức bằng cách sử dụng
SELECT film_id,count[film_id] as num_copies
FROM sakila.inventory
GROUP BY film_id
ORDER BY num_copies DESC;
Quốc gia Luận án Kết quả Trông thú vị? . Nó không có ý nghĩa đối với con người chúng ta, và nếu chúng ta có thể lấy được tên của những bộ phim, điều đó táo bạo hoặc có khả năng xử lý thông tin tốt hơn. Thứ bảy rình mò và xem bàn ________Ga_______7 Hass Got ________Ga_______8 S Val ST ________Ga_______9 Off T Film
Vì vậy, họ có tất cả dữ liệu, nhưng làm cách nào để họ có được dữ liệu đó trong một chế độ xem?
Hãy đến với quần jean để giải cứu. Chúng tôi cần thêm t ________ga_______9 vào thông tin bảng kiểm kê của chúng tôi. Chúng ta có thể làm điều này bằng cách sử dụng —
SELECT A.*, B.title
FROM sakila.inventory A
LEFT JOIN sakila.film B
ON A.film_id = B.film_id
Thao tác này sẽ thêm một cột khác vào thông tin bảng kiểm kê của bạn. Bạn có thể nhận thấy một số bộ phim có trong bảng ________ga_______7 mà không có trong bảng ________to_______2. Chúng tôi đã sử dụng phép nối trái vì chúng tôi muốn giữ bất cứ thứ gì có trong bảng kiểm kê và nối nó với phần đối ứng tương ứng của nó trong bảng
SELECT rating, avg[length] as length_avg
FROM sakila.film
GROUP BY rating
ORDER BY length_avg desc;
7 chứ không phải mọi thứ trong bảng SELECT rating, avg[length] as length_avg
FROM sakila.film
GROUP BY rating
ORDER BY length_avg desc;
7Vì vậy, không có cách nào có tiêu đề s trường khác trong dữ liệu. 2. Thứ được mong muốn, nhưng điều đó vẫn chưa giải được câu đố. Chúng tôi muốn ________ga_______9 và ________to_______6 của tiêu đề t trong khoảng không quảng cáo t
Nhưng trước khi bạn có thể tiến xa hơn, trước tiên bạn nên hiểu khái niệm về lõi bên trong.
truy vấn bên trong
Bây giờ bạn có một truy vấn có thể cung cấp cho bạn kết quả. Một điều bạn có thể làm là tạo một bảng mới bằng cách sử dụng
CREATE TABLE sakila.temp_table as
SELECT A.*, B.title FROM sakila.inventory A
LEFT JOIN sakila.film B
ON A.film_id = B.film_id;
Và sau đó sử dụng thao tác nhóm B đơn giản
SELECT title, count[title] as num_copies
FROM sakila.temp_table
GROUP BY title
ORDER BY num_copies desc;
Nhưng đây là một bước quá nhiều. Và bạn phải tạo một bảng tạm thời chiếm dung lượng trên hệ thống.
Tất cả cung cấp cho chúng tôi khái niệm truy vấn bên trong chỉ dành cho các vấn đề ngắn. Thay vào đó, bạn có thể sử dụng tất cả điều này trong một truy vấn duy nhất
SELECT temp.title, count[temp.title] as num_copies
FROM [
SELECT A.*, B.title
FROM sakila.inventory A
LEFT JOIN sakila.film B
ON A.film_id = B.film_id] temp
GROUP BY title
ORDER BY num_copies DESC;
What Be Did Here Was Sandwich Truy vấn đầu tiên của chúng tôi trong Parathesis và Bảng Govetha và Elias. Oi Than Đã T Hoạt Động Nhóm B Xem Xét ________To_______7 Cứ Mạnh Mẽ Xem Xét Bàn Khác. Chính nhờ khái niệm truy vấn bên trong mà bay có thể bay tất cả các chức năng trải rộng trên nhiều trang rất nhiều lần.
Trong t có mệnh đề
Tất cả các cấu trúc của có là hữu ích để hiểu. Vậy Là Đã Có Kết Quả Và Bây Giờ Là Muốn Có Được Phim Ohsi Số Bản Ore Les Thon Hoặc Bằng 2
Chúng ta có thể sử dụng khái niệm truy vấn bên trong và mệnh đề where. Hede bay tổ một truy vấn bên trong trẻ mồ côi. mạng đẹp
Hoặc, chúng ta có thể sử dụng t có mệnh đề
Mệnh đề có được sử dụng để lọc kết quả tổng hợp cuối cùng. KHÁC VỚI WHERE S WHERE ĐƯỢC DÙNG ĐỂ LỌC T BẢNG MÀ 2 ĐƯỢC SỬ DỤNG TRONG T TỪ TUYÊN BỐ. Có bộ lọc t kết quả cuối cùng sau khi t nhóm b xảy ra
Có rất nhiều chàng trai thích bài hát với tất cả những gì bạn đã thấy trong ví dụ. Chúng ta cần giảm độ dài của danh sách và do đó có ý nghĩa trong nhiều CSS.
Nếu bạn có thể theo dõi đến đây, bạn đã biết nhiều hơn hầu hết mọi người.
Điều tiếp theo là. luyện tập
Cố gắng đưa ra chi phí của bạn trên tập dữ liệu của bạn và cố gắng tìm ra câu trả lời mà bạn có bằng cách sử dụng tất cả.
Một số chi phí được cung cấp lạnh để bắt đầu
- Diễn viên nào có những bộ phim nổi bật nhất trong kho của chúng tôi?
- Thể loại phim nào được đánh giá cao nhất trong kho của chúng tôi?
học liên tục
Đây chỉ là một hướng dẫn đơn giản và cách thực hiện. Nếu bạn muốn tìm hiểu thêm về tất cả, tôi muốn gọi khóa học tuyệt vời và tất cả về khoa học dữ liệu của Đại học California. Kiểm tra nó ra là tất cả về các khái niệm telex như hợp, thao tác chuỗi, chức năng, xử lý ngày, v.v.
Tôi cũng sẽ viết nhiều bài viết thân thiện với người mới bắt đầu hơn trong tương lai. Theo dõi phương tiện này, đăng ký blog của tôi và được thông báo về nó. Luôn luôn, E hoan nghênh phản hồi và phê bình mang tính xây dựng và có thể được đăng lại trên Twitter @molhoiz
Ngoài ra, một tuyên bố từ chối trách nhiệm nhỏ - có thể có một số liên kết liên kết trong bài đăng này đến các tài nguyên có liên quan, vì vậy chia sẻ kiến thức không bao giờ là một ý tưởng tồi.