Tin Tức

Ví Dụ Về Dự Báo Chuỗi Thời Gian ) (P, Chương 5 : Mô Hình Chuỗi Thời Gian

Trong thực tế, chúng ta gặp rất nhiều các dữ liệu dạng chuỗi thời gian như: nhiệt độ trung bình của một vùng theo ngày, chỉ số chứng khoán, giá vàng,… Những dữ liệu ấy thường được biểu diễn dạng chuỗi giá trị biến đổi theo thời gian. Việc dự báo trước giá trị các dữ liệu này có vai trò vô cùng quan trọng trong đời sống hiện nay. Có rất nhiều phương pháp dự báo, tuy nhiên, cách tiếp cận theo lý thuyết mờ cho bài toán dự báo chuỗi thời gian là 1 trong những phương pháp đơn giản nhưng mang lại hiệu quả và cho độ chính xác ngày càng cải thiện.

Đang xem: Ví dụ về dự báo chuỗi thời gian

*

by Trịnh Hồng Ngọc
in Tọa đàm chia sẻ kinh nghiệm
0
0
SHARES
621
VIEWS
Share on FacebookShare on Twitter

PHẦN I: BÀI TOÁN DỰ BÁO

I. Khái quát về dự báo

Dự báo là một khoa học về nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tương lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được. Khi tiến hành dự báo cần căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một số mô hình toán học (Định lượng). Tuy nhiên dự báo cũng có thể là một dự đoán chủ quan hoặc trực giác về tương lai (Định tính) và để dự báo định tính được chính xác hơn, người ta cố loại trừ những tính chủ quan của người dự báo. Dù định nghĩa có sự khác biệt nào đó, nhưng đều thống nhất về cơ bản là dự báo bàn về tương lai, nói về tương lai. Dự báo trước hết là một thuộc tính không thể thiếu của tư duy con người, con người luôn nghĩ đến ngày mai, hướng về tương lai. Trong thời đại công nghệ thông tin và toàn cầu hóa, dự báo lại đóng vai trò quan trọng hơn khi nhu cầu về thông tin thị trường, tình hình phát triển tại thời điểm nào đó trong tương lai càng cao. Dự báo được sử dụng trong nhiều lĩnh vực khác nhau, mỗi lĩnh vực có một yêu cầu về dự báo riêng nên phương pháp sử dụng cũng khác nhau.

Không có cách nào để xác định tương lai là gì một cách chắc chắn (tính không chính xác của dự báo). Dù phương pháp chúng ta sử dụng là gì thì luôn tồn tại yếu tố không chắc chắn cho đến khi thực tế diễn ra.

Luôn có điểm mù trong các dự báo. Chúng ta không thể dự báo một cách chính xác hoàn toàn điều gì sẽ xảy ra trong tương lai. Hay nói cách khác, không phải cái gì cũng có thể dự báo được nếu chúng ta thiếu hiểu biết về vấn đề cần dự báo.

Dự báo cung cấp kết quả đầu vào cho các nhà hoạch định chính sách trong việc đề xuất các chính sách phát triển kinh tế, xã hội. Chính sách mới sẽ ảnh hưởng đến tương lai, vì thế cũng sẽ ảnh hưởng đến độ chính xác của dự báo.

Trong nền kinh tế thị trường, công tác dự báo là vô cùng quan trọng bởi lẽ nó cung cấp các thông tin cần thiết nhằm phát hiện và bố trí sử dụng các nguồn lực trong tương lai một cách có căn cứ thực tế. Với những thông tin mà dự báo đưa ra cho phép các nhà hoạch định chính sách có những quyết định về đầu tư, các quyết định về sản xuất, về tiết kiệm và tiêu dùng, các chính sách tài chính, chính sách kinh tế vĩ vô. Dự báo không chỉ tạo cơ sở khoa học cho việc hoạch định chính sách, cho việc xây dựng chiến lược phát triển, cho các quy hoạch tổng thể mà còn cho phép xem xét khả năng thực hiện kế hoạch và hiệu chỉnh kế hoạch.

Trong quản lý vi mô, công tác dự báo khoa học giúp doanh nghiệp đứng vững trong cạnh tranh và giành thắng lợi trong kinh doanh. Các dự báo về thị trường, giá cước, tiến bộ khoa học công nghệ, sự thay đổi các nguồn đầu vào, đối thủ cạnh tranh… có tầm quan trọng sống còn đối với các doanh nghiệp viễn thông. Ngoài ra dự báo còn cung cấp các thông tin cho phép phối hợp hành động giữa các bộ phận trong doanh nghiệp.

II. Các phương pháp dự báo

Có nhiều học giả có cách phân loại phương pháp dự báo khác nhau. Tuy nhiên theo học giả Gordon, trong 2 thập kỷ gần đây, có 8 phương pháp dự báo được áp dụng rộng rãi trên thế giới (Bảng 1).

Bảng 1 đề cập 8 phương pháp thường được sử dụng trên thế giới trong dự báo. Tuy nhiên, Việt Nam hiện chủ yếu sử dụng 3 phương pháp (trong một phương pháp có thể có nhiều mô hình khác nhau) dự báo sau đây.

Bản chất của phương pháp ngoại suy là kéo dài quy luật đã hình thành trong quá khứ để làm dự báo cho tương lai. Giả thiết cơ bản của phương pháp này là sự bảo toàn nhịp điệu, quan hệ và những quy luật phát triển của đối tượng dự báo trong quá khứ cho tương lai. Thông tin cung cấp cho phương pháp ngoại suy là số liệu về động thái của đối tượng dự báo trong quá khứ qua một số năm nhất định, thông thường yêu cầu thời khoảng quá khứ có số liệu phải lớn hơn nhiều lần thời khoảng làm dự báo. Phương pháp này thích hợp để dự báo những đối tượng phát triển theo kiểu tiệm tiến. Phương pháp ngoại suy có ưu điểm là đơn giản, tuy nhiên, nhược điểm chính là không tính được ảnh hưởng của các yếu tố khách quan đến kết quả dự báo.

Bản chất của phương pháp chuyên gia là lấy ý kiến đánh giá của các chuyên gia để làm kết quả dự báo. Phương pháp này được triển khai theo một quy trình chặt chẽ bao gồm nhiều khâu: thành lập nhóm chuyên gia, đánh giá năng lực chuyên gia, lập biểu câu hỏi và xử lý toán học kết quả thu được từ ý kiến chuyên gia. Khó khăn của phương pháp này là việc tuyển chọn và đánh giá khả năng của các chuyên gia. Phương pháp này được áp dụng có hiệu quả cho những đối tượng thiếu (hoặc chưa đủ) số liệu thống kê, phát triển có độ bất ổn lớn hoặc đối tượng của dự báo phức tạp không có số liệu nền. Kết quả của phương pháp dự báo này chủ yếu phục vụ cho nhu cầu định hướng, quản lý vì thế cần kết hợp (trong trường hợp có thể) với các phương pháp định lượng khác.

Bản chất của phương pháp này là kế thừa hai phương pháp nói trên. Cách thức tiếp cận của phương pháp này là dùng hệ thức toán học để mô tả mối liên hệ giữa đối tượng dự báo với các yếu tố có liên quan. Khó khăn của phương pháp này là phải viết được chính xác hệ thức toán học nói trên. Phương pháp mô hình hoá áp dụng cho nghiên cứu kinh tế, tài nguyên-môi trường sẽ phải sử dụng nhiều phương trình của mô hình kinh tế lượng vì đối tượng dự báo (mối liên hệ giữa hoạt động kinh tế và chất lượng môi trường, sử dụng tài nguyên) có liên quan đến nhiều yếu tố kinh tế ví dụ GDP, giá cả,… Phương pháp này yêu cầu số liệu của nhiều yếu tố hữu quan trong quá khứ trong khi đó, phương pháp ngoại suy chỉ yêu cầu một loại số liệu. Tuy nhiên, phương pháp này cũng có ưu điểm, đó là có thể giải thích được kết quả dự báo và có thể phân tích ảnh hưởng của các yếu tố liên quan đến kết quả dự báo.

Hiện tại nhiều nước đã có phần mềm dự báo này, tuy nhiên, khi áp dụng cho Việt Nam thì cần phải hiệu chỉnh một ít thông số cho phù hợp. Đặc biệt là mô hình dự báo kinh tế vĩ mô, cần xem xét yếu tố thể chế và tính mở của thị trường, nền sản xuất và dạng dữ liệu hiện có.

Hiện ở Việt Nam, các mô hình dự báo trong lĩnh vực tài nguyên và môi trường chưa nhiều. Mỗi lĩnh vực đặc thù đều áp dụng những công cụ/mô hình riêng, đáp ứng những yêu cầu cụ thể, những mô hình này chủ yếu chỉ áp dụng cho chuyên môn sâu. Ví dụ, trong lĩnh vực thủy văn để dự báo lũ, mô hình MARINE của Pháp, mô hình Mike11 (của Đan Mạch), mô hình SSARR, mô hình TANK,… được sử dụng, trong dự báo thời tiết thì sử dụng các mô hình về dự báo thời tiết,…

III. Quy trình thực hiện dự báo

Thông thường trong các dự báo, quy trình dự báo được chia thành các bước sau. Các bước này bắt đầu và kết thúc với sự trao đổi giữa người sử dụng và người làm dự báo.

Xác định mục tiêu dự báoXác định loại dự báoChọn mô hình dự báoThu thập số liệu và tiến hành dự báoỨng dụng kết quả dự báoTheo dõi kết quả dự báo

PHẦN 2: DỰ BÁO TRÊN CHUỖI THỜI GIAN MỜ

Chuỗi thời gian ( time series) trong thống kê, xử lý tín hiệu, kinh tế lượng và toán tài chính, … là một chuỗi các điểm dữ liệu, được đo theo từng khoảng khắc thời gian liền nhau theo một tần suất thời gian thống nhất. Ví dụ về chuỗi thời gian là giá đóng cửa của chỉ số chứng khoán VN-Index hoặc lưu lượng mực nước trung bình hàng năm của sông Hồng . Phân tích chuỗi thời gian bao gồm các phương pháp để phân tích dữ liệu chuỗi thời gian, để từ đó trích xuất ra được các thuộc tính thống kê có ý nghĩa và các đặc điểm của dữ liệu. Dự đoán chuỗi thời gian là việc sử dụng mô hình để dự đoán các sự kiện thời gian dựa vào các sự kiện đã biết trong quá khứ để từ đó dự đoán các điểm dữ liệu trước khi nó xảy ra (hoặc được đo). Chuỗi thời gian thường được vẽ theo các đồ thị.

Như đã biết, trong những suy luận đời thường cũng như các suy luận khoa học, logic toán học đóng một vai trò rất quan trọng. Ngày nay, xã hội càng phát triển thì nhu cầu con người ngày càng cao. Do đó, sự tiến bộ của khoa học cũng rất cao. Suy luận logic mệnh đề thông thường (tạm gọi là logic nguyên thủy hay logic rõ) với hai giá trị đúng, sai hay 1, 0 đã không giải quyết được hết các bài toán phức tạp nảy sinh trong thực tế.

Ví dụ: quần áo như thế nào được gọi là dầy, là mỏng để máy giặt biết được mà có chế độ tự động sấy khô cho hợp lý ?

Hay trong thơ văn có câu:

” Trăng kia bao tuổi trăng già?

Núi kia bao tuổi gọi là núi non? ”

Khái niệm trăng già hay núi non là không được định nghĩa rõ ràng. Những bài toán như vậy ngày một nhiều hơn trong các lĩnh vực điều khiển tối ưu, nhận dạng hệ thống,… nói chung là trong các quá trình quyết định nhằm giải các bài toán với các dữ liệu không đầy đủ, hoặc không được định nghĩa một cách rõ ràng (trong điều kiện thiếu thông tin chẳng hạn). Một cách tiếp cận mới đã mang lại nhiều kết quả thực tiễn và đang tiếp tục phát triển đó là cách tiếp cận của lý thuyết tập mờ (FUZZY SET THEORY), do giáo sư Lotfi Zadeh của trường đại học California – Mỹ đề ra năm 1965. Công trình này thực sự đã khai sinh một ngành khoa học mới là lý thuyết tập mờ và đã nhanh chóng được các nhà nghiên cứu công nghệ mới chấp nhận ý tưởng. Một số kết quả bước đầu và hướng nghiên cứu tiếp theo góp phần tạo nên những sản phẩm công nghiệp đang được tiêu thụ trên thị trường. Lý thuyết tập mờ ngày càng phong phú và hoàn chỉnh, đã tạo nền vững chắc để phát triển logic mờ. Có thể nói logic mờ (Fuzzy logic) là nền tảng để xây dựng các hệ mờ thực tiển, ví dụ trong công nghiệp sản xuất xi măng, sản xuất điện năng, các hệ chuyên gia trong y học giúp chuẩn đoán và điều trị bệnh, các hệ chuyên gia trong xử lý tiếng nói, nhận dạng hình ảnh,…Công cụ chủ chốt của logic mờ là tiền đề hóa và lập luận xấp xỉ với phép suy diễn mờ.

Như chúng ta đã biết, tập hợp thường là kết hợp của một số phần tử có cùng một số tính chất chung nào đó. Ví dụ : tập các sinh viên. Ta có :

T = { t / t là sinh viên }

Vậy, nếu một người nào đó là sinh viên thì thuộc tập T, ngược lại là không thuộc tập T. Tuy nhiên, trong thực tế cuộc sống cũng như trong khoa học kỹ thuật có nhiều khái niệm không được định nghĩa một cách rõ ràng. Ví dụ, khi nói về một “nhóm sinh viên khá”, thì thế nào là khá ? Khái niệm về khá không rõ ràng vì có thể sinh viên có điểm thi trung bình bằng 8.4 là khá, cũng có thể điểm thi trung bình bằng 6.6 cũng là khá ( dải điểm khá có thể từ 6.5 đến 8.5),… Nói cách khác, “nhóm sinh viên khá” không được định nghĩa một cách tách bạch rõ ràng như khái niệm thông thường về tập hợp. Hoặc, khi chúng ta nói đến một “lớp các số lớn hơn 10″ hoặc ” một đống quần áo cũ”,…, là chúng ta đã nói đến những khái niệm mờ, hay những khái niệm không được định nghĩa một cách rõ ràng. Các phần tử của nhóm trên không có một tiêu chuẩn rõ ràng về tính “thuộc về” ( thuộc về một tập họp nào đó). Đây chính là những khái niệm thuộc về tập mờ. Trong đối thoại hàng ngày chúng ta bắt gặp rất nhiều khái niệm mờ này. Ví dụ, một ông giám đốc nói: ” Năm qua chúng ta đã gặt hái được một số thành tích đáng khen ngợi. Năm tới đây chúng ta phải cố gắng thêm một bước nữa”. Đây là một câu chứa rất nhiều khái niệm mờ.

Logic mờ có thể biểu diễn bằng một đồ thị liên tục dạng như sau:

 

1.1.Định nghĩa tập mờ 

Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên Ω được xác định bởi hàm thuộc( membership function):

: Ω à <0,1>

0 1

: Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A(để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm ).

Khoảng xác định của hàm là đoạn <0,1>, trong đó giá trị 0 chỉ mức độ không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn.

Ví dụ 1: Một sự biểu diễn tập mờ cho các tập người đàn ông thấp, trung bình và cao.

chiều cao

Ví dụ 2: Cho Ω = {1, 2, 3, 4, 5}, tập mờ A trên W tương ứng với ánh xạ μA như sau:

μA : 1 → 0

2 → 1

3 → 0.5

4 → 0.3

5 → 0.2

Ta có tập mờ A = {(1,0), (2,1), (3,0.5), (4,0.3), (5,0.2)}

Cách viết trên là sự liệt kê các phần tử khác nhau cùng với mức độ thuộc về tập hợp A.

Từ định nghĩa trên chúng ta có thể suy ra:

– Tập mờ A là rỗng nếu và chỉ nếu hàm thuộc về μA(a)= 0 ,∀a∈ Ω

– Tập mờ A là toàn phần nếu và chỉ nếu μA(a) = 1 ,∀a∈ Ω

– Hai tập mờ A và B bằng nhau nếu μA(x) = μB(x) với mọi x trong Ω .

Ví dụ 3: Cho Ω = {1, 2, 3, 4, 5}, tập mờ A trên Ω tương ứng với ánh xạ μA như ví du trên.

A = {(1,0), (2,1), (3,0.5), (4,0.3), (5,0.2)}

Tập mờ B trên W tương ứng với ánh xạ μB như sau:

μB : 1 → 0

2 → 1

3 → 0.5

4 → 0.3

5 → 0.2

Ta có tập mờ B = {(1,0), (2,1), (3,0.5), (4,0.3), (5,0.2)}

Nhận thấy, μA(x) = μB(x) với mọi x trong Ω . Vậy A= B.

Để có thể tiến hành mô hình hóa các hệ thống có chứa tập mờ và biểu diễn các qui luật vận hành của hệ thống này, trước tiên chúng ta cần tới việc suy rộng các phép toán logic cơ bản với các mệnh đề có chân trị trên đoạn <0, 1>.

Cho Ω = {P1, P2, …} với P1, P2, … là các mệnh đề. Tập mờ A trên Ω tương ứng với ánh xạ v như sau:

v : Ω → <0, 1>

∀Pi ∈ Ω → v(Pi)

Ta gọi v(Pi) là chân trị của mệnh đề Pi trên <0, 1>.

Phép bù

Phép phủ định trong logic kinh điển là một trong những phép toán cơ bản cho việc xây dựng phép bù của 2 tập hợp. Để suy rộng phép này trong tập mờ chúng ta cần tới toán tử v(NOT P). Toán tử này phải thỏa các tính chất sau :

– v(NOT P) chỉ phụ thuộc vào v(P).

– Nếu v(P)=1 thì v(NOT P)=0

– Nếu v(P)=0 thì v(NOT P)=1

– Nếu v(P1) ≤ v(P2) thì v(NOT P1) ≥ v(NOT P2)

Phép giao

Phép hội AND trong logic kinh điển là cơ sở để định nghĩa phép giao của 2 tập mờ. AND thoả các tính chất sau :

– v(P1 AND P2) chỉ phụ thuộc vào v(P1), v(P2).

– Nếu v(P1)=1 thì v(P1 AND P2) = v(P2) , với mọi P2

– Giao hoán v(P1 AND P2) = v(P2 AND P1)

– Nếu v(P1) ≤ v(P2) thì v(P1 AND P3) ≤ v(P2 AND P3), với mọi P3

– Kết hợp v(P1 AND (P2 AND P3 )) = v((P1 AND P2 )AND P3 )

Phép hợp

Phép tuyển OR trong logic kinh điển là cơ sở để định nghĩa phép hợp của 2 tập mờ. OR thoả các tính chất sau :

– v(P1 OR P2) chỉ phụ thuộc vào v(P1), v(P2).

– Nếu v(P1) = 0 thì v(P1 OR P2) = v(P2) , với mọi P2

– Giao hoán v(P1 OR P2) = v(P2 OR P1)

– Nếu v(P1) ≤ v(P2) thì v(P1 OR P3) ≤ v(P2 OR P3), với mọi P3

– Kết hợp v(P1 OR (P2 OR P3 )) = v((P1 OR P2 ) OR P3 ).

Xem Thêm : Trung Tâm Gia Sư Bách Khoa Hà Nội Chuyên Dạy Kèm Môn Toán, Hóa

Một số qui tắc

Trong logic rõ với hai giá trị đúng, sai, có nhiều qui tắc đơn giản mà chúng ta thường sử dụng xem như tính chất hiển nhiên.

Ví dụ : với bất kỳ tập rõ A ⊂ Ω , ta có: AÇAc = ∅ và A ÈAc = Ω.

Thực ra, những qui tắc này có được là nhờ vào sự xây dựng toán học trước đó. Chuyển sang lý thuyết tập mờ thì hai tính chất quen dùng này đã không còn đúng nữa. Do đó, chúng ta cần xem xét lại một số tinh chất.

Tính lũy đẳng (demportancy)

Chúng ta nói T là lũy đẳng nếu T(x,x) = x, ∀x∈<0,1>.

Tương tự, S là lũy đẳng nếu S(x,x) = x, ∀x∈<0,1>.

Tính hấp thu (absorption)

Có hai dạng hấp thu :

– T(S(x,y),x) = x , ∀x,y∈<0,1>.

– S(T(x,y),x) = x , ∀x,y∈<0,1>.

Tính phân phối (distributivity)

Có hai biểu thức xác định tính phân phối:

– S(x,T(y,z)) = T(S(x,y), S(x,z)), ∀x,y,z∈<0,1>.

– T(x,S(y,z)) = S(T(x,y), T(x,z)), ∀x,y,z∈<0,1>.

Xem thêm: Giải Chi Tiết Đề Minh Họa 2018 Môn Lý, Lời Giải Chi Tiết Đề Minh Họa Môn Vật Lý Năm 2018

Luật De Morgan

Cho T là t-chuẩn, S là t-đối chuẩn, n là phép phủ định. Chúng ta có bộ ba (T,S,n) là một bộ ba De Morgan nếu :

n(S(x,y)) = T(nx,ny)

Phép kéo theo

Chúng ta sẽ xét phép kéo theo như một mối quan hệ, một toán tử logic. Ta có các tiên đề sau cho hàm v(P1 → P2) :

– v(P1 → P2) chỉ phụ thuộc vào v(P1), v(P2).

– Nếu v(P1) ≤ v(P3) thì v(P1 → P2) ≥ v(P3 → P2), ∀P2

– Nếu v(P2) ≤ v(P3) thì v(P1 → P2) ≤ v(P1 → P3), ∀P1

– Nếu v(P1) = 0 thì v(P1 → P) = 1 , ∀P.

– Nếu v(P1) = 1 thì v(P → P1) = 1 , ∀P.

– Nếu v(P1) = 1 và v(P2) = 0 thì v(P1 → P2) = 0.

Tính hợp lý của những tiên đề này dựa vào logic kinh điển và những tư duy trực quan của phép suy diễn. Từ tiên đề ban đầu (v(P1→ P2) chỉ phụ thuộc vào v(P1), v(P2)) khẳng định sự tồn tại của hàm số I(x,y) xác định trên <0,1>2 với mong muốn tính chân trị của phép kéo theo qua biểu thức

v(P1 → P2) = I(v(P1), v(P2))

III. Các quan hệ và suy luận xấp xỉ, suy diễn mờ

Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn ( suy luậnxấp xỉ) mờ. Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ đem lại hiệu quả lớn trong thực tế, mô phỏng được một phần suy nghĩ của conngười. Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triểnmạnh mẽ. Tuy nhiên chính logic mờ mở rộng được nghiên cứu và phát triểnmạnh mẽ. Tuy nhiên chính logic mờ mở rộng từ logic đa trị, do đó nảy sinh rarất nhiều các quan hệ mờ, nhiều cách định nghĩa các toán tử T – chuẩn, T- đốichuẩn, cũng như các phương pháp mờ hoá, khử mờ khác nhau,…Sự đa dạngnày đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợpnhất cho ứng dụng của mình.

Định nghĩa : Cho U ; V ; R là một tập mờ trên U x V gọi là một quan hệ mờ (quan hệ hai ngôi): 0≤ R(x,y) = ≤ 1

Tổng quát: R U1 x U2 x … Un là quan hệ n ngôi:

0 ≤ R(u1, u2,… un) = ( u1, u2,… un ) ≤ 1

Suy luận xấp xỉ hay còn gọi là suy luận mờ – đó là quá trình suy ra những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc , các luật,các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định.

Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận:

Định lý: “Nếu một hàm số là khả vi thì nó liên tục”

Sự kiện: Hàm f khả vi. à Kết luận: Hàm f là liên tục.

Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens.Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ.

Gọi Ω là không gian tất cả các hàm số, ví dụ Ω ={g:R àR }. A là các tậpcác hàm khả vi, B là tập các hàm liên tục. Xét hai mệnh đề sau: P=’g A’và Q=’g B’. Khi đó ta có:

Luật (tri thức): P Q

Sự kiện: P đúng (True)

Kết luận: Q đúng (True)

Xét bài toán suy luận trong hệ mờ ( suy diễn mờ ) 

Hệ mờ n biến vào x1, x2,… xn  và một biến ra y

Cho Un , i= n..n là các không gian nền của các biến vào , V là không gian nền của biến ra.

Hệ được xác định bởi m luật mờ:

R1: Nếu x1 là A11 và x2 … xn  là A1n thì y là B1.

R2: Nếu x1 là A21 và x2 … xn  là A2n thì y là B2.

Rn: Nếu x1 là An1 và x2 … xn  là Ann thì y là Bn.

Để giải bài toán này chúng ta phải thực hiện qua các bước sau:

Xác định các tập mờ của biến đầu vào.Xác định độ thuộc tại các tập mờ tương ứng.Xác định các quan hệ mờ R(A,B)(u,v).Xác định phép hợp thành.Tính B’ theo công thức: B’ = A’ R(A,B)(u,v).

Tùy theo từng lĩnh vực dự báo mà ta có thể lựa chọn các phương pháp dự báo khác nhau. Vì vậy phương pháp sử dụng mô hình dự báo số thí sinh dự thi với số liệu thống kê từ những năm trước, trên cơ sở đó để tìm ra những luật và đưa ra số liệu dự báo của năm tiếp theo.

Cách giải quyết giả sử số liệu của các năm trước là A1, A2, A3 … Anvà số liệu của năm cần dự báo là An+1.

Một cách làm thông thường truyền thống là từ số liệu thống kê ta có:

A1 à A2

A2 à A3

A3 à A4

……….

An-1 à An

An+1 = ???

Việc tính toán hay tìm ra quan hệ trong các số liệu thống kê của quá khứ theo phương pháp truyền thống thường phải thực hiện một khối lượng tính toán lớn, phức tạp. Trong trường hợp tìm các quan hệ mờ thì khối lượng tính toán còn lớn hơn nữa.

Từ những thông tin đã biết ta xây dựng các quan hệ:

R1 = A1T x A1

R2 = A1T x A2

R3 = A2T x A3

R1 = A3T x A4

………..

Cuối cùng chúng ta tính toán tìm ra quan hệ R bằng khối lượng tính toán rất lớn, phải tốn rất nhiều thời gian.

Vì thế có những trường hợp nếu khéo vận dụng lí thuyết tập mờ thì ta có thể giảm thiểu khối lượng tính toán vẫn cho kết quả đủ tốt. Nếu tìm phương pháp xây dựng các tập mờ, xây dựng các phép toán trên tập mờ hợp lí thì khối lượng các phép toán được giảm rất nhiều. Phương pháp sau đây chủ yếu sử dụng các phép tính đơn giản để giải quyết bài toán dự báo mờ.

Chúng ta dựa vào ghi danh thực tế Dmin và Dmax để xác định được tập không gian nền U là với D1 và D2 là số bù, theo dữ liệu tuyển sinh thực tế của trường ĐH Alabama thể hiện trong bảng, chúng ta thấy rằng Dmin = 13.055 và Dmax=19.337. Như vậy ban đầu chúng ta cho D1=55 và D2=337 thì tập không gian nền U = <13.000, 20.000>, vậy phương pháp dự báo tuyển sinh được trình bày như sau:

Bước 1: Phân vùng U = thì ta được bảy khoảng u1,… u7 với u1 = <13000,14000>, u2 = <14000,15000>, u3 = <15000,16000>, u4 = <16000,17000>, u5 = <17000,18000>, u6 = <18000,19000>, u7 = <19000,20000>.

Bước 2: Cho A1,… Ak là các tập mờ ta xác định trên tập nền U như sau:

A1= a11/u1 + a12/u2 + …+ a1m/um

A2= a21/u1 + a22/u2 + …+ a2m/um

Ak= ak1/u1 + ak2/u2 + …+ akm/um

Trong đó aij <0,1> với 1 i k và 1 j m.

Giá trị aij chỉ ra các lớp của các thành viên trong tập uj  trong Ai.

Trong nghiên cứu này, các ngôn ngữ chỉ ra các giá trị sau:

A1 = (không nhiều), A2 = (không quá nhiều) , A3 = (hơi nhiều), A4 = (nhiều ), A5 = (rất nhiều), A6= (quá nhiều), A7 = (quá quá nhiều) .

Nên A1= 1/u1 + 0,5/u2 +0,5/u3 +0,5/u4 +0,5/u5 +0,5/u6 +0,5/u7

A2= 0,5/u1 + 1/u2 +0,5/u3 +0,5/u4 +0,5/u5 +0,5/u6 +0,5/u7

A3= 0,5/u1 + 0,5/u2 +1/u3 +0,5/u4 +0,5/u5 +0,5/u6 +0,5/u7

A4= 0,5/u1 + 0,5/u2 +0,5/u3 +1/u4 +0,5/u5 +0,5/u6 +0,5/u7

A5= 0,5/u1 + 0,5/u2 +0,5/u3 +0,5/u4 +1/u5 +0,5/u6 +0,5/u7

Xem Thêm : Câu Hỏi Trắc Nghiệm Về Ngày 20/10, Bạn Biết Gì Về Ngày Phụ Nữ Việt Nam 20/10

A6= 0,5/u1 + 0,5/u2 +0,5/u3 +0,5/u4 +0,5/u5 +1/u6 +0,5/u7

A7= 0,5/u1 + 0,5/u2 +0,5/u3 +0,5/u4 +0,5/u5 +0,5/u6 +1/u7

Về việc ghi danh thực tế của trường Đại học Alabama được thể hiện trong bảng sau:

Năm Ghi danh thực tế Tập mờ
1971 13055 A1
1972 13563 A1
1973 13867 A1
1974 14696 A2
1975 15460 A3
1976 15311 A3
1977 15603 A3
1978 15861 A3
1979 16807 A4
1980 16919 A4
1981 16388 A4
1982 15433 A3
1983 15497 A3
1984 15145 A3
1985 15163 A3
1986 15984 A3
1987 16859 A4
1988 18150 A6
1989 18970 A6
1990 19328 A7
1991 19337 A7
1992 18876 A6

Bảng 1:Ghi danh thực tế trường Đại học Alabama

Ta nhận thấy các mối quan hệ logic mờ theo nguyên tắc sau:

Năm i suy ra năm i +1 ( Ai àAi+1)

Lưu ý: Các quan hệ lặp đi lặp lại chỉ tính 1 lần.

Bảng 2: Từ bảng 1 ta suy ra bảng 2:

Mối quan hệ logic mờ của ghi danh tuyển sinh

(A1à A1) (A1à A2) (A2à A3) (A3à A3)

(A3à A4) (A4à A4) (A4à A4) (A4à A6)

(A6à A6) (A6à A7) (A7à A3) (A7à A7)

Bảng 3: Chia các nhóm có vế trái giống nhau

Nhóm 1: (A1à A1) (A1à A2)

Nhóm 2: (A2à A3)

Nhóm 3: (A3à A3) (A3à A4)

Nhóm 4: (A4à A3) (A4à A4) (A4à A6)

Nhóm 5: (A6à A6) (A6à A7)

Nhóm 6: (A7à A6) (A7à A7)

Bước 4: Tính toán kết quả đầu ra của dự báo

Các tính toán được thực hiện theo những nguyên tắc sau:

Ở đây ta chia thành các trường hợp.

Trường hợp 1: Vế phải chỉ có 1 phần tử ( vế trái suy ra 1 vế phải ) ta tính như sau:

Ví dụ:

Nhóm 2: (A2à A3) phần tử có độ thuộc vào A3 lớn nhất tương ứng với u3. Ta lấy điểm giữa của u3 làm giá trị dự báo: =15.500

Trường hợp 2: Vế trái có nhiều vế phải ta tính như sau:

Ví dụ:

Nhóm 4: (A4à A3) (A4à A4) (A4à A6)

Xét các vế phải là A3, A4, A6 có độ thuộc lớn nhất tương ứng với các khoảng u3, u4, u6 . Vậy điểm trung bình của u3, u4, u6 lần lượt là: 15.500, 16.500, 18.500 .Việc dự báo sẽ lấy trung bình cộng của các giá trị này là:

16833.

Trường hợp 3: Với những năm Aj mà Aj không thuộc nhóm nào , như vậy ta xét như là Ajà Aj và xem u nào thuộc Aj với độ thuộc lớn nhất lấy điểm giữa làm giá trị ra.

Trong quá trình dự báo chúng ta phải thu thập tất cả các thông tin quá khứ và hiện tại, những thông tin đó là những yếu tố cần thiết đóng vai trò quan trọng để tính toán, xử lý và đưa ra những thông tin cần thiết để quyết định cho tương lai, nhưng trong điều kiện thông tin nhân được vừa thiếu, vừa không chính xác, không đầy đủ thì dự báo thật sự vô cùng cần thiết.

Việc tính toán hay tìm ra quan hệ trong các số liệu thống kê của quá khứ theo phương pháp truyền thống thường phải thực hiện một khối lượng tính toán lớn, phức tạp hơn. Trong trường hợp tìm các quan hệ mờ thì khối lượng tính toán còn lớn hơn nữa. Vì thế có những trường hợp nếu khéo vận dụng lí thuyết tập mờ thì ta có thể giảm thiểu khối lượng tính toán mà vẫn cho kết quả tốt. Nếu tìm những phương pháp xây dựng các tập mờ, xây dựng các phép toán trên tập mờ hợp lí thì khối lượng các phép toán được giảm rất nhiều.

Cách tính toán trình bày ở trên là một trong các phép toán trên.

Theo các tính toán trình bày ở trên thì việc chia khoảng là việc rất quan trọng. Nếu việc chia khoảng nhỏ thì khối lượng tính toán lớn mặc dù kết quả tính toán có thể tốt hơn. Ngược lại, nếu chia khoảng lớn thì giảm thiểu khối lượng tính toán nhưng kết quả có độ chính xác không cao. Phần thử nghiệm chương trình sẽ khẳng định điều đó.

PHẦN 3: ỨNG DỤNG DỰ BÁO SỐ HỌC SINH ĐĂNG KÝ NGUYỆN VỌNG VÀO HỌC VIỆN QUẢN LÝ GIÁO DỤC

Xây dựng chương trình thử nghiệm

Xử lý dữ liệuCài đặt chương trìnhXây dựng Lớp Tập Mờ

public string _year;

public int _data;

public string _name;

public string _khoangU;

public int _dataDubao;

Xây dựng Lớp Quan Hệ Mờ

public string _vetrai;

public string _vephai;

public int _TBC;

Xây dựng Lớp Nhóm Quan Hệ Mờ

public string _name;

public QuanHeMo<> _quanhe;

public int _soquanhe;

public int _TBC;

Giao diện và các chức năng chương trìnhChức năng nhập dữ liệu

Nhập năm

Nhập số liệu đăng ký thực tế

Click chuột nút Thêm/Sửa/Xóa

Lấy dữ liệu từ SQLServer

Định khoảng dự báo và xác định các tập mờ

Nhập khoảng

Click chuột vào nút xử lý

Xử lý quan hệ mờ

Click chuột vào nút Xử Lý

 

Dự Báo Kết Quả Đăng Kí

Nhập năm cần dự báo

Click nút Dự báo

Xem Biểu Đồ

Biểu đồ đường thẳng

Biểu đồ cột

Biểu đồ điểm

PHẦN 4: NHỮNG THỬ NGHIỆM CHƯƠNG TRÌNH

Kết quả thu được:

 

Như vậy, với dữ liệu có nhiều biến động, nếu chỉ dựa hoàn toàn vào số liệu đăng ký hàng năm, kết quả dự báo sẽ sai lệch rất lớn. Đòi hỏi phải xây dựng được dữ liệu theo khối, phân tích xem lý do dẫn đến biến động về số người đăng ký, nếu có sự biến động thì tye lệ đăng ký thay đổi thế nào. Từ đó kết hợp các số liệu mới cho ra kết quả chính xác hơn.

Với khoảng chia mặc định 1000, kết quả thu được là:Với khoảng chia 500, kết quả thu được là:Với khoảng chia 100, kết quả thu được là:

Như vậy, với khoảng chia càng nhỏ, việc dự báo càng chuẩn xác hơn với tỷ lệ sai lệch nhỏ. Tuy nhiên việc chia bé khoảng dữ liệu sẽ dẫn tới khối lượng tính toán tăng cao. Đặc biệt với các bài toán có dữ liệu lớn, có thể mất lượng thời gian rất lớn để xử lý.

Nếu vì lý do nào đó(thất lạc, mất,…) mà dữ liệu bị thiếu sót một số năm, việc dự báo theo phương pháp chuỗi thời gian mờ sẽ bị hạn chế, đòi hỏi phải kết hợp với phương pháp nội suy để xử lý dữ liệu.

KẾT LUẬN

Nắm được phương pháp dự báo dựa trên chuỗi thời gian mờHướng phát triển

 

TÀI LIỆU THAM KHẢO

 

<1>. Chuỗi thời gian và phát triển bài toán dự báo – Đào Duy Luật.

<2>. Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian – Nguyễn Thị Kim Loan,Luận văn Thạc sỹ,Đại học Thái Nguyên.

<3>. M.Sah, K.Y Degtiave, “ Forecasting Enrollment Model Based on Fisr Order Fuzzy Time Series”, Transaction on Engineering, Computing and technology Enfomatika, v.IV, pp, 375-378,2004.

Xem thêm: Thông Tin Tuyển Sinh Trường Cao Đẳng Y Tế Đồng Nai, Trường Cao Đẳng Y Tế Đồng Nai

<4>. Dự báo chuỗi thời gian mờ dựa trên ngữ nghĩa – Nguyễn Duy Hiếu, Vũ Như Lân, Nguyễn Cát Hồ, báo cáo nghiên cứu khoa học cấp Nhà nước.

Nguồn: https://xettuyentrungcap.edu.vn
Danh mục: Tin Tức

Related Articles

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Back to top button