CÂY QUYẾT ĐỊNH LÀ GÌ

  -  

Cây ra quyết định (Decision Tree) là một cây phân cấp cho bao gồm cấu tạo được dùng để phân lớp những đối tượng người sử dụng dựa vào hàng các luật pháp (series of rules). khi đến tài liệu về những đối tượng người sử dụng tất cả những nằm trong tính với lớp (classes) của chính nó, cây quyết định sẽ có mặt các lao lý để tham gia đoán lớp của các đối tượng chưa biết (unseen data).

Bạn đang xem: Cây quyết định là gì

I. CẤU TRÚC DECISION TREESDecision Trees gồm 3 phần chính: 1 node gốc (root node), rất nhiều node lá (leaf nodes) và các nhánh của chính nó (branches). Node nơi bắt đầu là vấn đề bước đầu của cây ra quyết định với cả nhị node gốc cùng node đựng thắc mắc hoặc tiêu chí và để được vấn đáp. Nhánh trình diễn các công dụng của khám nghiệm bên trên nút ít. lấy một ví dụ câu hỏi sinh hoạt node thứ nhất tận hưởng câu vấn đáp là “yes” Hoặc là “no” thì đã có 1 node con Chịu trách rưới nhiệm đến bình luận là “yes”, 1 node là “no”.

*


II. CÁC THUẬT TOÁN LIÊN QUAN TỚI DECISION TREES
ID3 (Iterative sầu Dichotomiser 3) AlgorithmThuật tân oán ID3 có thể được tóm tắt nlỗi sau: 
Lấy toàn bộ những ở trong tính không được thực hiện với đếm entropy liên quan đến mẫu thử của các trực thuộc tính đóChọn nằm trong tính bao gồm entropy bự nhấtNối node cùng với thuộc tính đó

ID3 (Examples, Target_Attribute, Attributes)

Begin:

Tạo node gốcNếu toàn bộ các examples (ví dụ) hồ hết nằm cùng một lớp là dương thì return một nút ít lá được gán nhãn do lớp đó (lớp +).Nếu toàn bộ những examples (ví dụ) phần đa ở cùng một lớp là âm thì return một nút ít lá được gán nhãn bởi vì lớp kia (lớp -).Nếu tập ở trong tính Attributes là rỗng thì return Cây đưa ra quyết định bao gồm nút ít Root được đính thêm cùng với nhãn lớp bởi quý giá chung tuyệt nhất vào tập nằm trong tính làm việc tập ví dụ (Examples).

Else begin:

Chọn thuộc tính A – Thuộc tính vào tập Attributes có tác dụng phân loại “xuất sắc nhất” so với ExamplesThuộc tính soát sổ mang đến nút ít Root ← A với đem nó làm cho nơi bắt đầu mang đến cây hiện tạiVới mỗi giá trị vi của A: Bổ sung một nhánh cây mới nằm phía dưới node cội, tương ứng cùng với trường vừa lòng A = viXác định Examples(vi) thế nào cho tập con của Examples có mức giá trị vi mang đến ANếu Examples(vi) rỗng

# Tạo một nút lá được đính nhãn = giá trị đích thông dụng tốt nhất vào Examples. Sau đó gắn thêm nút lá này vào nhánh cây mới vừa sản xuất.

trái lại, đã nhập vào nhánh cây new vừa sinh sản một cây con có mặt vì chưng ID3 (Examples(vi), Target_Attribute, Attributes – A)Kết thúcTrả về giá trị node gốc

C4.5 Algorithm

C4.5 là thuật toán phân lớp tài liệu dựa trên cây ra quyết định công dụng cùng thịnh hành Một trong những vận dụng khai phá cửa hàng dữ liệu tất cả size nhỏ. C4.5 phát hành cây đưa ra quyết định trường đoản cú tập training data giống như nhỏng ID3.

Xem thêm: " Physical Memory Là Gì : Định Nghĩa, Ví Dụ Trong Tiếng Anh, Physical Memory Usage Là Gì

Tập training data S tất cả các mẫu đã được phân một số loại sẵn s1, s2,… Mỗi chủng loại mê mẩn = x1,x2,… với x1, x2 là một trong vector màn biểu diễn cho trực thuộc tính hoặc điểm lưu ý của mẫu. Một tập vector C = c1,c2,… cùng với c1, c2 màn biểu diễn cho mỗi lớp cơ mà từng mẫu mã ở trong về.

Với mỗi lớp của cây, C4.5 lựa chọn 1 thuộc tính của dữ liệu mà phân chia tập các chủng loại thành các tập bé, được cải thiện unique một bí quyết tác dụng độc nhất. Tiêu chuẩn chỉnh của nó là thu được information gain (sự khác biệt về entropy) – công dụng từ những việc lựa chọn một trực thuộc tính cho vấn đề phân tách bóc tách tài liệu. Quyết định chỉ dẫn dựa trên tập ở trong tính với information gain được chuẩn chỉnh hóa tối đa. Thuật toán thù C4.5 tiếp đến đã tái diễn cùng với những list nhỏ nhỏ tuổi rộng.


– Tất cả những chủng loại đa số nằm trong và một lớp. Khi điều này xảy ra, nó chỉ đơn giản dễ dàng tạo nên một nút ít lá mang lại cây quyết định với cho biết chọn lớp kia.
– Không bao gồm chức năng như thế nào cung cấp ngẫu nhiên information gain. Trong trường đúng theo này, C4.5 tạo nên một node đưa ra quyết định (decision node) bằng phương pháp áp dụng quý giá kì vọng của lớp kia.

Xem thêm: 8 Nghề Không Có Bằng Cấp Thì Làm Gì Để Ổn Định Và Thăng Tiến ?


– Với những ngôi trường đúng theo khác, C4.5 đợt tiếp nhữa tạo ra một node quyết định bằng cách thực hiện giá trị kì vọng của lớp đó.

Thuật toán được lời giải nhỏng sau: