Skip to main content

One post tagged with "tài chính"

View All Tags

Kiểm Định Phân Phối Chuẩn trong Phân Tích Định Lượng

· 3 min read

1. Giới Thiệu

Trong phân tích định lượng, việc kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không là rất quan trọng. Điều này ảnh hưởng đến việc áp dụng các mô hình thống kê và dự đoán. Hai phương pháp phổ biến để kiểm định tính chuẩn của dữ liệu là:

  • Kiểm định Kolmogorov-Smirnov (KS Test)
  • Kiểm định Shapiro-Wilk (SW Test)

2. Mã Python Kiểm Định Phân Phối Chuẩn

from scipy.stats import kstest, shapiro
import pandas as pd

# Hàm kiểm định phân phối chuẩn
def test_normality(column):
# KS Test
ks_stat, ks_p_value = kstest(column, 'norm', args=(column.mean(), column.std()))

# SW Test
sw_stat, sw_p_value = shapiro(column)

return ks_stat, ks_p_value, sw_stat, sw_p_value

# Gọi hàm
result = {}
for col in ['open', 'high', 'low', 'close', 'volume']:
ks_stat, ks_p_value, sw_stat, sw_p_value = test_normality(data[col])
result[col] = {
'KS statistic': ks_stat,
'KS p-value': ks_p_value,
'SW statistic': sw_stat,
'SW p-value': sw_p_value
}

# Chuyển đổi result về DataFrame để hiển thị
normality_result_df = pd.DataFrame(result).T

# Hiển thị kết quả
print(normality_result_df)

3. Kết Quả

KS statisticKS p-valueSW statisticSW p-value
open0.1679826.179856e-030.8205631.116056e-09
high0.2125001.927959e-040.8130426.354731e-10
low0.1561911.347956e-020.8316662.637595e-09
close0.1748053.832952e-030.8353213.528857e-09
volume0.4244577.338898e-170.2715245.035959e-20

4. Diễn Giải Kết Quả

  • KS Test: Nếu giá trị p-value nhỏ hơn 0.05, dữ liệu có thể không tuân theo phân phối chuẩn.
  • SW Test: Nếu giá trị p-value nhỏ hơn 0.05, giả thuyết phân phối chuẩn bị bác bỏ.
  • Trong kết quả trên, tất cả các cột đều có giá trị p-value nhỏ hơn 0.05 trong cả hai kiểm định, chứng tỏ dữ liệu không tuân theo phân phối chuẩn.

5. Kết Luận

Kết quả kiểm định cho thấy dữ liệu không tuân theo phân phối chuẩn, điều này có thể ảnh hưởng đến các phương pháp phân tích thống kê tiếp theo. Khi đó, cần xem xét các phương pháp xử lý như biến đổi dữ liệu (log, sqrt), sử dụng các mô hình phi tuyến tính hoặc phương pháp không tham số.


Bài viết cung cấp kiến thức cơ bản về kiểm định phân phối chuẩn và cách áp dụng với dữ liệu tài chính thực tế.