Nghịch lý bạn bè: vì sao bạn của ta có nhiều bạn hơn ta?

Nghịch lý bạn bè: vì sao bạn của ta có nhiều bạn hơn ta?

(Tác giả: Trần Quý Phi – Nguồn: statistics.vn)

Phần lớn chúng ta sẽ nhận thấy rằng những người bạn của mình có nhiều bạn hơn mình. Hiện tượng đó được gọi là “nghịch lý bạn bè” (friendship paradox). Hiện tượng này được Scott L. Feld đưa ra trong một bài báo cách đây 20 năm: Why Your Friends Have More Friends Than You Do [1]?

Sau đây là ví dụ gốc của Feld trong bài báo nói trên:

Xét 1 nhóm gồm 8 nữ sinh (ngôn ngữ xã hội học gọi là một social network) trong 1 trường trung học, gồm: Betty, Sue, Alice, Jane, Pam, Dale, Carol và Tina. Một số trong họ là bạn của nhau. Ta biểu diễn họ và mối quan hệ của họ dưới dạng một đồ thị (graph) trong đó mỗi người là một đỉnh (vertex), khi hai người là bạn của nhau thì ta nối hai đỉnh tương ứng bằng một cạnh (edge).

friendship_para_1

Như vậy số cạnh đi từ một đỉnh chính là số bạn của người đó.

Chẳng hạn (con số phía trước ngoài dấu ngoặc trong hình trên):

Betty: có 1 bạn (là Sue)

Sue: có 4 bạn (là Betty, Alice, Pam và Dale).

Dale: có 3 bạn (là Alice, Sue và Jane).

Ngôn ngữ graph gọi là các con số đó là bậc (degree) của các đỉnh.

Bây giờ ta xem con số rắc rối hơn, được đặt trong dấu ngoặc ở hình trên.

Ví dụ với Dale:

Bạn của Dale: Jane, Alice và Sue.

Số bạn của Jane là 2

Số bạn của Alice là 4

Số bạn của Sue là 4.

Tổng số bạn của Jane, Alice và Sue là 2+4+4 = 10.

Vậy số bạn trung bình của các bạn Dale (có 3 người)  là 10/3 = 3.3

Sau đây là bảng tổng kết của Feld trong ví dụ trên:

friendship_para_2

So sánh hai cột đầu và cột cuối thì chỉ có 2 trường hợp mà số bạn trung bình của bạn nhỏ hơn số bạn của một cá nhân (Sue và Alice).

Phần lớn các trường hợp (phần lớn các cá nhân) đều có số bạn nhỏ hơn số bạn trung bình của bạn bè họ. Đó là cách diễn đạt khác của nghịch lý này.

Nói theo tiếng Anh (dễ hiểu hơn tiếng Việt :-)) là: “Your friends have more friends than you” hoặc chính xác hơn là “Most people have fewer friends than their own friends have”.

Để dễ diễn đạt ta ký hiệu: trong mạng có n người, số bạn bè của một người i là Fi, tổng số bạn trong mạng là \sum F_{i} . Mỗi người có số bạn trung bình là \sum F_{i}/n

Số bạn của các bạn của người i là FFi (friends of friends), tổng số bạn của bạn trong mạng là \sum FF_{i}. Trung bình số bạn của bạn là \sum FF_{i}/\sum F_{i}.

Theo ví dụ của Feld ở trên thì

n=8

\sum F_{i} = 20

mean(F) =\sum F_{i}/n= 20/8 = 2.5

\sum FF_{i} = 60

mean(FF) =\sum FF_{i}/\sum F_{i}= 60/20 = 3 (không phải là 60/8 !!!)

Ta sẽ chứng tỏ là mean(F) < mean(FF). Từ đó suy ra trong phần lớn trường hợp, nhiều người trong mạng có ít bạn hơn bạn của mình.

Ta dùng một sơ đồ đơn giản hơn để minh họa lập luận:

friendship_para_3

Xét người 1.  1 có ba bạn (2,3,5), do đó khi tính FF2 thì 1 xuất hiện và đóng góp 3 mối quan hệ bạn bè vào \sum FF_{i}, khi tính FF3 và FF5 cũng vậy. Vậy khi tính  \sum FF_{i} thì 1 xuất hiện 3 lần, mỗi lần đóng góp 3 mối quan hệ, tức là 3 x 3 vào \sum FF_{i}.

Một cách tổng quát một người thứ i sẽ đóng góp Fi lần, mỗi lần Fi mối quan hệ, toàn bộ là Fi x Fi mối quan hệ, vào tổng FF. Do đó

\sum FF_{i}=\sum F_{i}^{2}

mean(FF)=\sum F_{i}^{2}/\sum F_{i}

Bằng một vài biến đổi đại số ta có thể chứng minh rằng (chi tiết xem dưới):

mean(FF)=mean(F)+\frac{variance(F)}{mean(F)}

(chính là: mean(FF)=mean(F)+CV(F))

Rõ ràng là mean(F)” src=”http://latex.codecogs.com/gif.latex?mean%28FF%29%3Emean%28F%29&#8243; alt=”mean(FF)>mean(F)” />

Từ công thức này ta cũng thấy nghịch lý này rõ hơn ở các mạng xã hội trong đó số bạn có phương sai lớn, tức là một số người có quá ít bạn, ngược lại có người có quá nhiều bạn, vì lúc đó mean(FF) sẽ lớn hơn mean(F) nhiều.

Trần Quý Phi

Ghi thêm:

Chứng minh: mean(FF)=mean(F)+\frac{variance(F)}{mean(F)}

\frac{\sum x^2}{\sum x}=\frac{\sum x}{n}+\frac{\sum x^2}{\sum x}-\frac{\sum x}{n}

\frac{\sum x^2}{\sum x}-\frac{\sum x}{n}=\frac{\left n\sum x^2-(\sum x  \right)^2 }{n\sum x}

Nhân cả tử và mẫu của vế phải cho \frac{1}{n^2} thì nó trở thành

\frac{\left 1/n\sum x^2-(1/n\sum x  \right)^2 }{1/n\sum x}

Mẫu số là mean(F) rồi. Còn ở tử, có một công thức rất quen thuộc là :

var(X)=mean(X^2)-mean(X)^2

(phương sai bằng trung bình bình phương trừ bình phương trung bình )

Từ đó suy ra kết quả cần có.

Tham khảo:

[1] Scott L. Feld, (1991) Why Your Friends Have More Friends Than You Do,The American Journal of Sociology, Vol. 96, No. 6 (May, 1991), pp. 1464-1477. Có thể tải tại đây

————–&&————–

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s

%d bloggers like this: