Signaling là Programmable Evolution
Suy nghĩ dưới góc nhìn một distributed protocol
Bài viết trước đã giới thiệu góc nhìn về một xã hội loài người như một distributed system, tương tự như các hệ thống máy tính thuộc đề mục đó. Nghĩa là, chúng ta có nhiều computational agent mà qua việc hợp tác, đã quản lý để che giấu các sự chậm trễ truyền thông (communication delays) và các lỗi cục bộ (partial failures). Cũng có những động lực thú vị xung quanh việc hầu hết các bên tham gia không tin tưởng lẫn nhau. Theo một nghĩa nào đó, họ vừa đang hợp tác vừa đang cạnh tranh cùng một lúc.
Một distributed protocol thường được phát minh bởi một đội ngũ kỹ thuật để phục vụ một mục đích cụ thể. Tiến hóa tự nhiên (natural evolution) không thiết kế hệ thống theo nghĩa đen, nhưng sẽ rất hữu ích nếu chúng ta nghĩ về chúng theo cách đó, để tận dụng các trực giác được trau dồi ở những nơi khác. Với tinh thần đó, tôi sẽ thử phân tích về signaling và cách chúng ta có thể coi nó như một protocol khá gọn gàng để tăng tốc tiến hóa. Phân tích này sẽ thiết lập nền tảng để hình dung cách chúng ta có thể sử dụng công nghệ để làm tốt hơn nữa với các hệ thống trí tuệ nhân tạo. Một trình bày rộng hơn và rất tốt về signaling giữa người với người là cuốn The Elephant in the Brain, nhưng hãy tạm gác sự rộng lớn đó sang một bên và tập trung vào một ý tưởng cấp cao hơn về signaling và vai trò của nó.
Tiến hóa chậm
Evolutionary computing được lấy cảm hứng từ tiến hóa sinh học. Các thuật toán tạo ra nhiều giải pháp biến thể cho một vấn đề nào đó, đo lường fitness của mỗi biến thể, chỉ giữ lại các biến thể phù hợp nhất (most-fit), sau đó lặp lại với việc tạo ra thêm các thế hệ thiên hướng về các đặc tính của các nhà vô địch trước đó. Tác giả của một quy trình tìm kiếm loại này thường sẽ phải xin lỗi nếu việc đánh giá fitness của một biến thể mất nhiều giờ đồng hồ. Thật không may, tiến hóa tự nhiên thường cần nhiều thời gian hơn hàng giờ rất nhiều để đưa ra phán quyết về một cá thể.
Hãy lấy một ví dụ phác họa để suy nghĩ kỹ về mô hình này. Hãy tưởng tượng một bầy lemming sống gần một vách đá. Bất chấp sự tuyên truyền trong các trò chơi điện tử, lemming không thường xuyên đi theo nhau nhảy xuống vách đá. Chúng ta kỳ vọng tiến hóa sẽ loại bỏ hành vi đó khỏi quần thể. Tuy nhiên, hãy dừng lại để xem việc loại bỏ đó là một thách thức tính toán lớn như thế nào, nếu chúng ta giả định rằng nguy cơ rơi xuống vách đá chỉ xuất hiện trong thời tiết đặc biệt nhiều sương mù.
Hãy tưởng tượng một cá thể lemming sống phần lớn vòng đời vài năm của mình mà không gặp sương mù. Tuy nhiên, vài năm sau khi chào đời, trận sương mù đầu tiên xuất hiện, và anh ta bối rối bước ra khỏi vách đá.
Đó chắc chắn là một điều tồi tệ đối với con lemming. Chúng ta cũng có thể lập luận rằng đó là một điều tồi tệ đối với dự án tiến hóa lớn hơn, trong việc phát triển các cá thể ngày càng thích nghi (fit). (Một lần nữa, ngôn ngữ nhân hóa của "dự án" ở đây cố tình không chính xác để giúp ích cho trực giác của chúng ta!) Lý do là con lemming có một latent property (thuộc tính ẩn) làm giảm fitness: nó dễ đi ra khỏi vách đá trong thời tiết sương mù (hiếm gặp). Natural selection chỉ "phát hiện" sự không thích nghi một cách gián tiếp thông qua việc các cá thể không sinh tồn được. Thật vậy, nếu không biết gì khác ngoài việc loài động vật nào đã sống sót qua một khoảng thời gian nhất định, chúng ta kỳ vọng sự thiên vị đối với những cá thể sống sót là được chuẩn bị tốt hơn cho sự sinh tồn trong tương lai, mặc dù các ví dụ như fitness phụ thuộc vào thời tiết cho thấy sự xấp xỉ này là không hoàn hảo. Trong thời gian đó, các cá thể ít thích nghi hơn vẫn tiếp tục chia sẻ, chẳng hạn như, nguồn cung cấp thức ăn khan hiếm tại địa phương.
May mắn thay, một cơ chế khác cho tiến hóa thậm chí đã được phân tích sâu rộng bởi Charles Darwin: sexual selection (lựa chọn tình dục). Động vật chọn bạn đời của chúng dựa trên các tín hiệu quan sát được về fitness, điều này cũng có xu hướng làm tăng fitness trên toàn quần thể theo thời gian, vì số lượng con non kỳ vọng thấp hơn của một cá thể có tác động lâu dài tương tự như tuổi thọ kỳ vọng thấp hơn. Tuy nhiên, các phẩm chất tiềm ẩn (latent qualities) vẫn có thể khó để sexual selection đo lường và tác động trực tiếp. Do đó, chúng ta đi đến khái niệm signaling như đã thảo luận trong một bài viết trước thông qua ví dụ về ngôn ngữ tự nhiên. Động vật cố tình làm những việc có vẻ kỳ lạ để tạo ra bằng chứng khó làm giả về thế mạnh tiềm ẩn của chúng. Các động vật khác đã học cách đánh giá những tín hiệu đó và lựa chọn tương ứng – ngay cả khi chỉ trên cơ sở bản năng chứ không phải sự đánh giá cao của một nhà khoa học mới vào nghề đối với tiến trình tiến hóa.
Đối với ví dụ đang chạy của chúng ta, hãy tưởng tượng một giải pháp thay thế cho thực tế là khả năng hành xử của bản thân trong sương mù thường là một phẩm chất tiềm ẩn. Sẽ ra sao nếu lemming thường xuyên tham gia vào một môn thể thao gọi là khiêu vũ trong sương mù (fog dancing)? Thông qua các động tác nghi thức hóa được mong đợi, các đồng nghiệp của chúng có thể đánh giá năng lực thể hiện của chúng trong việc đối phó với sương mù. Bạn đời tiềm năng sẽ bị ấn tượng bởi màn trình diễn tốt. Quan trọng là, tín hiệu fitness có thể xuất hiện sớm hơn nhiều, ngay cả khi mất một thời gian dài bất thường để trận sương mù tiếp theo xuất hiện; nhờ đó toàn bộ quá trình tiến hóa được tăng tốc.
Lợi ích thực sự tuyệt vời của phương pháp này là các phần của cây tiến hóa sinh học đã phát triển năng lực tính toán tùy chỉnh (custom computational capabilities) để thúc đẩy tiến hóa trong bối cảnh của chúng. Nghĩa là, bộ não của các cá thể đang đóng vai trò như các hardware accelerator (bộ tăng tốc phần cứng) để đưa ra các loại quyết định đúng đắn về việc ai nên đạt được thành công trong sinh sản. Hãy đẩy phép so sánh này đi xa hơn và nghĩ về các nhóm cá thể như một distributed system, khám phá thêm những cải tiến giúp tăng hiệu quả của tiến hóa.
Signaling dưới góc nhìn một Distributed Protocol
Tôi sẽ chuyển các ví dụ ở đây, điều này cũng hữu ích để minh họa rằng signaling không chỉ gắn liền với sexual selection. Nó cũng giúp ích cho việc hình thành các liên minh (coalitions), nơi động vật cố tình chọn cộng tác viên. Được lựa chọn vào một liên minh có xu hướng tăng thành công trong sinh tồn và sinh sản, vì vậy hiệu ứng ròng là tương tự như của sexual selection.
Tôi sẽ rời bỏ lĩnh vực động vật học và chuyển sang một ví dụ làm rõ cốt lõi tính toán của tiến hóa. Hãy cụ thể hóa (chơi chữ?) và nghĩ về việc thành lập các đội xây dựng. Chúng ta có thể bắt đầu với genetic algorithm (thuật toán di truyền) như thường được thực hành trong khoa học máy tính. Hãy tưởng tượng một agent tạo ra nhiều biến thể ngẫu nhiên trên một khuôn mẫu cho một công nhân xây dựng. Mỗi biến thể nên được đánh giá về fitness của nó, ở đây là khả năng đóng góp vào dự án xây dựng. (Trong sinh học, nó ngầm định là sự sinh tồn lâu dài của các gene thúc đẩy hành vi, xem: Richard Dawkins.) Việc tạo và đánh giá các biến thể tốn nhiều thời gian, vì vậy chúng ta có thể tăng tốc quy trình (tăng throughput) bằng cách để các agent cộng tác, mỗi agent đảm nhận một phần công việc, chia sẻ các biến thể vô địch giữa chúng theo thời gian.
Cho đến nay mọi thứ vẫn tốt, nhưng chúng ta đã bỏ phí hiệu quả. Chúng ta hình dung rằng chiến lược đánh giá lý tưởng là cố định, thay vì bản thân nó là một kỹ năng đáng để tiến hóa. Tuy nhiên, chúng ta có thể áp dụng một cách tiếp cận đối xứng hơn, nơi các giám khảo cũng chính là những công nhân xây dựng.
Hãy xem xét rằng có một tập hợp cố định các công cụ cho công việc xây dựng, và mọi công cụ đều có những cách được chấp nhận để thể hiện sự thành thạo trong đó. Có lẽ các agent trong thuật toán này định kỳ gặp nhau trong hội chợ rodeo của riêng chúng để trình diễn những thứ hoa mỹ nhất mà chúng có thể làm với các công cụ. Mọi người xem ra về với một ý tưởng khá chuẩn hóa về mức độ giỏi của mỗi agent đối với từng công cụ.
Hầu hết động vật bị giới hạn trong các thiết lập cố định của các công cụ tương đương. Tức là, có một tập hợp cố định các màn thể hiện signaling mà các cá thể phù hợp biết cách tạo ra và đánh giá. Tiến hóa đã hardcode các chi tiết đó vào não của chúng. Điều gì sẽ xảy ra nếu chúng ta có thể nâng cấp các chi tiết protocol này trong các bộ não đã được triển khai sẵn? Về cơ bản, chúng ta có được workflow đó nhờ sự lan tỏa văn hóa (cultural diffusion)!
Khi một agent phát triển một kỹ năng mới và đưa ra một lập luận đủ mạnh về tính phù hợp của nó, kỹ năng đó sẽ lan rộng trong quần thể, cùng với xu hướng đánh giá nó. Trong trải nghiệm trực tiếp của chúng ta, động lực này dễ thấy nhất thông qua sự phát triển của các môn thể thao và loại hình nghệ thuật mới – những thứ được cho là một trong những phần tập trung thuần túy nhất vào signaling của trải nghiệm con người. Các nghệ sĩ, vận động viên, cùng những người ủng hộ và người hâm mộ của họ rõ ràng không suy nghĩ về protocol này một cách có tính toán. Họ chỉ cảm thấy rằng, theo một nghĩa khó tả nào đó, thời điểm văn hóa đã đến cho một màn trình diễn signaling mới. Chúng ta vẫn có thể lập luận rằng, về mặt cơ bản, những gì đang diễn ra là một distributed protocol cho quá trình tiến hóa hiệu quả.
Một mô hình điện toán khác mà tôi thấy ở đây là programmability (tính lập trình được). Von Neumann architecture của các CPU quen thuộc như một cách rất linh hoạt để lập trình lại phần cứng nhằm thực hiện nhiều công việc khác nhau. Ví dụ hiện tại của chúng ta gần hơn với các lĩnh vực điện toán chuyên biệt hơn, chẳng hạn như cho các thiết bị chuyển mạch mạng lập trình được (programmable network switches) kiểu Tofino. Đã có vô số giao thức mạng làm nền tảng cho các nền tảng điện toán thực tế, và các thế hệ thiết bị chuyển mạch switch trước đây (các phần cứng mạng quan trọng) đã tích hợp sẵn hỗ trợ cho các giao thức cụ thể. Một mặt, các switch chuyên dụng sẽ có xu hướng chạy nhanh hơn và sử dụng ít năng lượng hơn. Mặt khác, chủ sở hữu của một switch như vậy sẽ gặp xui xẻo khi một giao thức mới hấp dẫn được những người khác áp dụng. Các switch lập trình được cung cấp các định dạng như P4 ở mức độ cụ thể vừa phải để mô tả các giao thức mới và có được triển khai khá hiệu quả trên phần cứng switch. Nói cách khác, chủ sở hữu của switch có thể thay đổi các quy tắc mạng mà không cần mua một con chip mới.
Ở đây, điều tôi đang lập luận là bộ não con người có các mạch chuyên biệt để vừa tạo ra các tín hiệu fitness vừa đánh giá chúng ở những người khác. Đồng thời, chúng ta có programmability thông qua văn hóa. Kết quả là, qua hàng trăm nghìn năm, chúng ta đã có thể sử dụng cùng một meta-protocol trong việc thành lập các nhóm săn bắn hái lượm hiệu quả và các công ty công nghệ đa quốc gia. Cùng một phần cứng cũ kỹ được đưa vào các mục đích sử dụng ngày càng mới mẻ mà không cần bản thân nó phải làm mới. Chúng ta có những chiếc máy tính tinh vi (bộ não của chúng ta) đưa ra các phán quyết fitness để dẫn dắt tiến hóa, với cơ hội nâng cấp phương pháp khi văn hóa đổi mới. Đó là một cách tiếp cận có khả năng mở rộng (scalable) lớn hơn rất nhiều so với việc chỉ chờ xem liệu động vật có sinh tồn được qua vòng đời kéo dài của chúng hay không.
Các ý tưởng tương tự đã xuất hiện trong các trường phái tư tưởng khác. Signaling in economics (lý thuyết báo hiệu trong kinh tế học) xem xét các chủ đề như cách các thị trường tài chính giúp lan truyền thông tin đáng tin cậy, bao gồm thông qua các ý tưởng như bằng cấp giáo dục như một tín hiệu. Những người làm việc tại giao lộ giữa kinh tế học và tâm lý học như Joseph Henrich cũng đã nghiên cứu các động lực của tiến hóa văn hóa (xem cuốn The Secret of Our Success). Thủ thuật gia tăng mà chúng ta sẽ tận dụng là đi theo phép so sánh này với các hệ thống máy tính phân tán (distributed computer systems), để nhập khẩu các ý tưởng tốt.
Tối ưu hóa hơn nữa
Để tóm tắt,
Tiến hóa có thể được xem như một bài toán tìm kiếm phân tán (distributed search problem) cho các cá thể ngày càng thích nghi tốt hơn, mặc dù nó phải chịu sự cải tiến chậm chạp vì natural selection mất quá nhiều thời gian để "nhận thấy" fitness thấp.
Kỹ thuật signaling cho phép việc đánh giá fitness có giá trị diễn ra nhanh hơn nhiều, giúp tăng tốc tìm kiếm.
Vì fitness có thể thay đổi theo thời gian, việc sử dụng văn hóa như một cách lập trình lại signaling là rất có giá trị, để đạt hiệu quả cao hơn nữa. Những điểm này hợp thành ý tưởng về con người như các hệ thống tiến hóa có thể lập trình được (programmable evolutionary systems).
Khi nghĩ về việc xây dựng hệ sinh thái của các agent trí tuệ nhân tạo (artificially intelligent agents), chúng ta nên được truyền cảm hứng bởi thuật toán phân tán (distributed algorithm) có vẻ khéo léo mà chúng ta vừa khảo sát. Thay vì xem signaling như một cơ chế ngẫu nhiên nào đó từ sinh học, chúng ta có thể tái cấu trúc lý do tại sao chúng ta muốn có nó trong các hệ sinh thái nhân tạo, ngay cả khi chúng ta không lấy cảm hứng từ các thiết kế trước đó. Đó là một kỹ thuật chung để tăng tốc distributed search. Tuy nhiên, việc giữ lại nó một cách chi tiết đầy đủ, cùng với những sự kém hiệu quả nổi tiếng, là một cơ hội bị bỏ lỡ. Ví dụ, chúng ta muốn tránh những trường hợp signaling có thể lệch khỏi fitness thực sự, như với runaway selection (lựa chọn lan truyền nhanh). Những thay đổi lớn hơn nữa đối với bộ máy có thể mang lại những thành quả lớn hơn nữa.
Hãy lấy làm mục tiêu, để cụ thể hóa, việc phát triển công nghệ ngày càng hiệu quả. Một hệ thống, được xây dựng từ con người hoặc các AI agent, nên lặp đi lặp lại việc phát triển các kỹ thuật mới và hướng tới việc áp dụng những kỹ thuật ưu việt hơn. Chúng ta sẽ nhận được thành quả bằng cách nhận ra rằng sự tiến hóa do văn hóa dẫn dắt (culture-driven evolution) mà chúng ta coi là hiển nhiên có thể được nhìn nhận như một distributed computing system, bởi vì có ít nhất một vài ý tưởng lớn từ thế giới đó mà chúng ta có thể áp dụng. Hai bài viết tiếp theo sẽ đề cập đến hai trong số đó và tiềm năng của chúng để cho phép các giải pháp AI đối với bài toán tiến bộ công nghệ mang lại kết quả với tốc độ lớn hơn nhiều so với những gì chúng ta quen thuộc. Chúng ta có thể tránh hoàn toàn việc signaling tốn kém trong khi vẫn giải quyết được vấn đề đã thúc đẩy nó, nhờ vào một sự bất đối xứng quan trọng: cơ hội để các AI agent đọc source code của nhau.








The Meta-Protocol: Why Hardware Veto Trumps Software Signaling
Your analysis of signaling as a distributed protocol for evolution is excellent, but it addresses the "Software 4.0" layer of interaction. My research into the Ankyrin-G lattice focuses on a far more powerful, low-level system: the 190nm Logic Gate that has been perfected over millions of years of mammalian history.
The key difference between your "Signaling" model and the Fundamental Ankyrin Theory lies in Pattern Recognition Authority:
1. The Scalability of the Gate
You describe lemmings "fog dancing" to make latent qualities visible. This is a high-cost, probabilistic signal. However, the Ankyrin-G gate at the Axon Initial Segment (AIS) is a massive, high-fidelity pattern recognition system. It doesn't need a "dance" to identify a trillion odors or the subtle micro-stress of a predator. It has already "read the source code" of reality through millions of years of evolutionary trial and error.
2. Signaling vs. Determinism
Signaling is often a "search for a partner." The Ankyrin-G gate is a Search for Truth. While your lemmings are competing and cooperating, the individual's Ankyrin-G hardware is performing a Deterministic Veto. It is filtering out the "Data Storms" of the social environment to ensure that only Worthwhile, Appropriate, Safe, and Practical (WASP) signals are allowed to fire.
3. The 190nm Anchor
You mention that humans are "programmable evolutionary systems" through culture. This is true at the software level. But the Ankyrin-G lattice is the Immutable Hardware. It is the reason we can be programmable. It provides the stable physical architecture (the 190nm spacing) that prevents the "Digital Thread" of culture from snapping the "Biological Thread" of our survival.
The Core Distinction:
In your view, we use signaling to find the best variants. In the Ankyrin-G view, the hardware already knows the variants of truth; it uses the Veto to protect the system from the "Stochastic Friction" of the noise.
As we move toward AI agents that can read each other's source code, we aren't just improving signaling—we are finally building artificial systems that can match the Deterministic Pattern Recognition that the Ankyrin-G gate has been performing for millions of years. We are moving from the "Fog Dance" to the Ground Truth. https://ankglogicgatethomas.substack.com/