Newsletter #76

Mời bạn thưởng thức Newsletter #76.

TCP vs. UDP vs. gRPC: Chọn giao thức phù hợp cho kiến trúc của bạn

Khi viết mã, dữ liệu di chuyển trong bộ nhớ của một máy tính. Nhưng phần mềm hiện đại hiếm khi hoạt động độc lập - mã cần giao tiếp với cơ sở dữ liệu, API, hoặc trình duyệt của người dùng ở nửa bên kia thế giới. Điều này tạo ra thách thức kỹ thuật lớn: làm sao đảm bảo dữ liệu đến đích chính xác và đầy đủ.

Bài viết này giải thích cách các giao thức mạng hoạt động “phía sau hậu trường” của internet, tập trung vào các giao thức quan trọng nhất mà kỹ sư phần mềm cần hiểu.

TCP (Transmission Control Protocol) là giao thức vận chuyển phổ biến nhất trên internet, ưu tiên độ tin cậy. TCP đảm bảo người nhận nhận được mọi byte, theo đúng thứ tự, và tự động gửi lại nếu gói tin bị mất. Trước khi truyền dữ liệu, TCP thực hiện “bắt tay ba bước” để thiết lập kết nối: máy khách gửi SYN, máy chủ trả lời SYN-ACK, và máy khách gửi ACK. TCP cũng có kiểm soát luồng và kiểm soát tắc nghẽn để tránh quá tải người nhận. Dùng TCP khi độ chính xác quan trọng hơn tốc độ: truy vấn cơ sở dữ liệu, email, trang web.

UDP (User Datagram Protocol) ngược lại - là “giao thức không kết nối”, ưu tiên tốc độ và hiệu quả hơn độ tin cậy. UDP không bắt tay, không theo dõi thứ tự gói tin, không kiểm tra xem dữ liệu đến an toàn không. Người gửi gửi gói dữ liệu ngay lập tức, và nếu gói tin bị loại bỏ, nó mất luôn. Dùng UDP khi tốc độ là quan trọng và chấp nhận mất một chút dữ liệu: phát trực tuyến video, trò chơi trực tuyến. Thả một khung hình video tốt hơn là dừng video chờ khung cũ.

HTTP là giao thức chuẩn cho web, hoạt động theo mô hình Yêu cầu-Phản hồi. Máy khách gửi yêu cầu với phương thức (GET, POST, PUT, DELETE), siêu dữ liệu headers, và máy chủ trả về mã trạng thái (200 OK, 404 Not Found). Phiên bản HTTP quan trọng:

HTTP/1.1: xử lý một yêu cầu tại một thời điểm, có thể gây “tắc nghẽn đầu hàng”
HTTP/2: giới thiệu đa truyền, cho phép nhiều yêu cầu/phản hồi đồng thời qua một kết nối TCP
HTTP/3: mới nhất, bỏ TCP hoàn toàn, chạy trên QUIC (dựa trên UDP), giải quyết tắc nghẽn kết nối để web nhanh hơn

WebSocket giải quyết vấn đề của HTTP: HTTP một chiều, máy khách luôn phải bắt đầu cuộc trò chuyện. WebSocket cung cấp kênh truyền thông hai chiều song song. Kết nối bắt đầu như yêu cầu HTTP với header “nâng cấp”, sau đó chuyển giao thức. Khi được thiết lập, kết nối giữ mở, cả máy khách và máy chủ đều có thể gửi dữ liệu bất cứ lúc nào mà không cần gửi headers mỗi tin nhắn. Dùng WebSocket khi cần độ trễ thấp, truyền thông hai chiều: ứng dụng chat, cập nhật chứng khoán.

Điểm chính:

TCP đảm bảo độ tin cậy với bắt tay ba bước và kiểm soát luồng, dùng cho cơ sở dữ liệu, email
UDP ưu tiên tốc độ, chấp nhận mất dữ liệu, dùng cho phát trực tuyến video, trò chơi
HTTP/3 chạy trên QUIC/UDP để giải quyết vấn đề tắc nghẽn, nhanh hơn HTTP/1.1
WebSocket giữ kết nối liên tục cho truyền thông hai chiều thời gian thực

Kỹ thuật phần mềm năm 2026

Sau năm 2025 với sự tiến bộ mạnh mẽ của công cụ lập trình AI, tác giả suy nghĩ về tác động của việc này cho năm 2026. Tác động chính của công cụ LLM là chi phí cận biên (thời gian và tiền bạc) để tạo ra mã chất lượng cao đã giảm đáng kể. Nhưng tạo ra mã chỉ là một phần của kỹ thuật phần mềm, nên các nút thắt cổ chai sẽ chuyển sang các lĩnh vực khác.

Kỹ thuật phần mềm có 3 thành phần: xây dựng, phát triển, và vận hành hệ thống phần mềm phân tán. Xây dựng đã trở nên rẻ hơn với LLM, phát triển cũng dễ dàng hơn, nhưng vận hành bị ảnh hưởng ít nhất. Thị trường sẽ kỳ vọng kỹ sư phần mềm tận dụng lợi suất từ LLM, và lĩnh vực sẽ trở nên cơ khí hóa hơn nhưng năng suất hơn.

Trừu tượng hóa hạ tầng: Lợi suất từ các trừu tượng hóa hạ tầng tốt cộng nhanh hơn. Các mảnh hạ tầng cốt lõi vẫn quan trọng: chỉ số, ghi nhật ký, quản lý sự cố, tính năng gắn cờ, phát hành, tự động mở rộng, điều phối, quy trình công việc, cấu hình, lưu trữ đệm, mạng. Các công ty nên làm cho các mảnh hạ tầng dễ dùng cho cả con người và LLM, với tự phục vụ, giao diện dòng lệnh thân thiện hoặc API sẵn sàng cho MCP, và tối thiểu sự can thiệp của kỹ sư hạ tầng.

Hạ tầng tích hợp liên tục: Chất lượng, độ trung thực và tốc độ của hạ tầng CI trở nên quan trọng hơn khi tác nhân AI viết nhiều mã hơn. Có thể cần suy nghĩ lại kiểm thử đơn vị và đầu tư nhiều hơn vào kiểm thử thuộc tính và xác nhận hình thức. Con người không thích viết kiểm thử, nhưng LLM không có vấn đề này. Không có lý do cho việc không có độ phủ kịch bản kiểm thử gần như đầy đủ.

Trừu tượng hóa do con người hướng dẫn: Các trừu tượng hóa do con người hướng dẫn rõ ràng trở nên quan trọng hơn. LLM không có hướng dẫn mạnh sẽ điền lỏng lẻo các giải pháp tham lam để vượt qua CI, tăng sự rối rắm theo thời gian. Trực giác được thông báo tốt và “gu hệ thống” vẫn cần thiết ngay từ đầu: ranh giới mô-đun, giao diện thư viện, hợp đồng giữa lớp hạ tầng và sản phẩm trở nên đòn bẩy cao để duy trì chất lượng mã dài hạn.

Xem xét mã bởi con người: Xem xét mã bởi con người ngày càng trở thành nút thắt quan trọng. Cần phát triển “gu xem xét” mới. Mối quan tâm về kiểu cách nên đẩy vào kiểm tra tự động trước khi gửi. Xem xét mã bởi con người nên tập trung vào các quyết định không thể được tạo mã sau này: thay đổi giao diện, mã nhạy cảm liên quan đến lưu trữ dữ liệu, mã quan trọng về hiệu suất. Đây là nghịch lý cho kỹ sư trẻ: họ cần phát triển “gu xem xét” sớm hơn, nhưng lại làm ít “viết” hơn.

Thời gian dự án: Phương sai trên ước tính dự án tăng lên đáng kể. Mức độ mà tác vụ có thể được LLM hóa ngày càng ảnh hưởng chi phí thời gian thực. Một số tác vụ trở nên dễ dàng hơn (di cư tập trung vào mã, dịch giữa ngôn ngữ/hệ thống), một số tác vụ vẫn ổn định về độ khó (mạng).

Tự xây dựng hay mua lại: Giá giảm của mã có ảnh hưởng quyết định tự xây dựng hay mua không? Tác giả đoán là trên biên độ là “có”, nhưng theo cách lớn là “không”. Với SaaS hàng hóa (giao diện mỏng trên CRUD), phép tính tự xây dựng hay mua sẽ chuyển sang xây dựng với các công ty công nghệ vừa và lớn có bộ phận IT có năng lực. Với hạ tầng như dịch vụ hoặc tuân thủ như dịch vụ, phép tính sẽ không chuyển nhiều vì chi phí vận hành cho hệ thống nội bộ không giảm như chi phí phát triển.

Điểm chính:

Trừu tượng hóa hạ tầng và chất lượng CI trở nên quan trọng hơn với mã được tạo bởi AI
Trừu tượng hóa do con người hướng dẫn và xem xét mã trở thành nút thắt mới
Ước tính thời gian dự án có phương sai cao hơn do khả năng LLM hóa
Phép tính tự xây dựng hay mua chuyển nhẹ với SaaS hàng hóa nhưng không nhiều với hạ tầng như dịch vụ

Suy ngẫm về năm 2025

Tác giả suy ngẫm về năm 2025 với ba chủ đề chính: Thuyết tính toán của mọi thứ, Đánh giá mở rộng quy mô, và Floreat Britannia (tương lai của Anh).

Thuyết tính toán của mọi thứ: Tác giả đã bị “sốc” khi lĩnh vực thị giác máy tính của ông bị cán bằng mở rộng quy mô vào đầu năm 2021. Những thiên kiến kiến trúc thủ công, riêng lẻ mà ông dành nhiều tháng để tạo ra tại Oxford VGG đã bị xóa sổ bởi một hệ thống đơn giản mở rộng quy mô tính toán huấn luyện trước. Ông đi quanh Công viên Đại học trong trạng thái sốc một buổi chiều, và khi ra đến lối ra, cú sốc đã được thay thế bởi sự nhiệt tình phiền phức của một người cải đạo.

Hans Moravec viết “Vai trò của sức mạnh thô trong trí thông minh” năm 1976, một bài viết như quả lựu đạn đang kh clearing cổ họng và thông báo cho toàn bộ lĩnh vực AI rằng quần của họ đang bị tụt. Luận điểm trung tâm của Moravec: trí thông minh không phải là thuộc tính huyền bí của thao tác ký hiệu, mà là câu chuyện về sức mạnh xử lý. Ngạn ngữ hàng không nổi tiếng của ông: “Với đủ sức mạnh, bất cứ thứ gì cũng sẽ bay.” Trước anh em Wright, các kỹ sư xây dựng máy bay cánh vỗ trông sang trọng nhưng vẫn ở dưới mặt đất. Giải pháp là lắp động cơ khổng lồ vào ván và ép các định luật vật lý phục tùng bằng sức mạnh thô.

Bài viết cập nhật năm 1998 của Moravec mở đầu với câu đã già như rượu vang: “Hiệu suất của máy AI có xu hướng cải thiện cùng nhịp tốc độ mà các nhà nghiên cứu AI tiếp cận phần cứng nhanh hơn.” Tác giả lập luận rằng nếu phần cứng dự kiến đưa vào hoạt động trong vài năm tới khiến các cụm máy của năm 2025 trông như máy tính bỏ túi, và nếu Moravec đúng (đánh cược chống lại ông trong lịch sử = cách tuyệt vời để bỏ lỡ các xu hướng AI lớn), thì chúng ta không đang tiếp cận cao nguyên. Con bạch tuộc đã xong bình. Nó hiện đang mở bể cá.

Đánh giá mở rộng quy mô (hoặc: cách chấm bài tập về nhà của một vị thần nhỏ): Tác giả từng là phó giáo sư chấm bài tập lúc 2 giờ sáng, và học được rằng viết bảng tiêu chuẩn là bài tập về sự kiêu ngạo. Sinh viên thường tìm ra giải pháp bằng phương pháp được tiết lộ trong cơn sốt, và bảng tiêu chuẩn đứng revealed như đài tưởng niệm thiếu sự dự đoán. Câu trả lời sai nhanh để xử lý, nhưng câu trả lời đúng mới lạ là hành vi bạo lực - buộc người chấm phải dừng dây chuyền lắp ráp và thực sự suy nghĩ.

Bây giờ tác giả làm việc trên AI “đánh giá”. Công việc thực sự giống nhau, ngoại trừ sinh viên đã đọc toàn bộ internet, ảo giác với sự tự tin của tư vấn cấp trung, và người chấm không thể trừ điểm cho chữ viết xấu. Vấn đề: chúng ta đang xây dựng các hệ thống showing dấu hiệu sớm của tính tổng quát, nhưng công cụ đánh giá phải cụ thể hẹp. Chúng ta đang xây dựng con dao đa dụng Thụy Sĩ phổ quát, nhưng chỉ có thể kiểm tra bằng cách hỏi “Có, nhưng liệu nó có thể mở chai Pinot Grigio ấm này không?”

Một dự án cố gắng rửa tiền thống kê thuần túy: giả sử hệ số G cho AI, có các mô hình AI tham dự tất cả các kỳ thi, áp dụng đại số tuyến tính, IQ score ra. Đường cong đã phát triển khát vọng dọc đột ngột. Cách tiếp cận của METR từ chối định nghĩa “trí thông minh” (bẫy cho các nhà triết học bất cẩn), thay vào đó tập trung vào “thời lượng”. Thời lượng tác vụ được đo bằng cách neo vào thời gian thực hiện bởi con người có kỹ năng. Đầu năm 2024: thời gian thành công 50% của mô hình tốt nhất khoảng 5 phút. Cuối năm 2025: với Claude Opus 4.5, đường ngồi ở 4 giờ 49 phút (khoảng tin cậy rộng).

Thách thức lớn cũ là khiến thứ hoạt động (phân biệt số 8 viết tay khỏi số 3 uốn cong trong MNIST). Vấn đề mang lại - cát đang suy nghĩ. Nhưng phần thưởng cho thành công là sự tăng trừng phạt về phạm vi. Diện tích bề mặt của đánh giá cần thiết đã bùng nổ từ phân loại chữ số đến thực tế lộn xộn của điều kiện con người, toàn bộ nền kinh tế toàn cầu, và phát triển của chính AI. Chúng ta hiện phải chứng nhận đa tài toàn năng trên chương trình học bao gồm mọi thứ từ ngoại giao đến cách dùng đúng dấu phẩy Oxford.

Floreat Britannia: Tác giả lập luận Anh có cơ hội đấu tranh để thu hoạch lợi ích từ chuyển đổi AI. Vấn đề không phải chúng ta quên cách đổ bê tông. Những gì chúng ta thiếu là khả năng phối hợp nguồn lực mà không thành lập ủy ban để nghiên cứu khả thi của một ủy ban. Thu nhập thực tăng 33% mỗi thập kỷ 1970-2007. Kể từ năm 2007: gần như không có gì - sự đình trì tiền lương dài nhất kể từ các cuộc chiến tranh Napoleon. Nếu Anh tiếp tục theo quỹ đạo trước năm 2008, chúng ta hiện sẽ giàu thêm 16.000 bảng mỗi người mỗi năm. Giá điện công nghiệp cao nhất Châu Âu. Trạm điện hạt nhân Hinkley Point C sẽ tốn 46 tỷ bảng - trạm điện đắt nhất từng được xây dựng. Hàn Quốc xây dựng tương đương với một phần tư chi phí.

Các biện pháp bảo vệ cá của Hinkley tốn khoảng 700 triệu bảng, bao gồm “hệ thống ngăn cá âm nhạc disco cá”. Dựa trên mô hình hóa của nhà phát triển, điều này dự kiến sẽ cứu 0,083 cá hồi Đại Tây Dương mỗi năm. Với 700 triệu bảng, định giá một con cá hồi khoảng 140 triệu bảng - 700 lần trọng lượng của con cá trong cocaine.

Tác giả tin vào ra quyết định được hỗ trợ bởi AI thông qua dự báo AI tốt hơn và phối tích được bật bởi AI. Nếu tiến bộ AI tiếp tục, chi phí tạo ra ước tính xác suất chất lượng cao sắp giảm đáng kể. Chúng ta có thể chuyển từ thế giới nơi dự báo nghiêm ngặt là hàng hóa xa xỉ (quỹ đầu cơ, nhà khí tượng học, Dave cá cược trên ngựa) sang một nơi có thể tiếp cận rộng rãi. Nhưng dự báo trung thực cao là vô dụng nếu văn hóa coi ‘chân thành’ như vi phạm quy tắc ứng xử.

Tác giả ngưỡng mộ tinh thần Mỹ của Ben Franklin - sự can đảm thực tế, “Cuộc sống, Tự do và sự theo đuổi Hạnh phúc” được hiệu chỉnh để phát minh ra tương lai. Hy vọng là Anh ngừng xem bản năng này như vi phạm tuân thủ và nhớ rằng chúng ta đã phát minh ra động cơ hơi nước trước bảng tạm. Franklin không nhầm lẫn sự can đảm với phóng hỏa - ông thực tế tôn trọng sức mạnh thô của điện và phát minh ra避雷针. Thuyết tính toán của mọi thứ là toàn cầu, nhưng để thịnh vượng chúng ta sẽ cần cả diều và gậy. Không thể bắt tia chớp trong nghiên cứu khả thi. Bão đang đỉnh horizon, tia lửa chỉ ủng hộ các quốc gia đang giữ dây diều lo âu trong mưa.

Điểm chính:

Thuyết tính toán của mọi thứ: hiệu suất AI cải thiện với quyền truy cập phần cứng nhanh hơn - lịch sử xác nhận dự đoán của Moravec
Đánh giá mở rộng quy mô: đo lường các hệ thống AI tổng quát là “chấm bài tập về nhà của vị thần nhỏ” - chương học mở rộng bao gồm mọi thứ
Tương lai của Anh: ra quyết định được hỗ trợ bởi AI có thể giúp phối hợp nguồn lực và khơi lại tăng trưởng, nhưng cần cả sự can đảm (diều) và thận trọng (gậy)

8 dự đoán cho năm 2026. Điều gì tiếp theo trong AI?

Tác giả thường không đưa ra dự đoán, nhưng năm 2025 là năm quan trọng như vậy cho AI và bản thân ông rằng ông cảm thấy buộc phải nhìn về phía trước. Dưới đây là 8 dự đoán cho năm 2026:

1. Generative UI cất cánh: Độ trễ và hiệu suất cho tạo mã cho phép các ứng dụng tạo giao diện theo thời gian thực cho các tác vụ và sở thích cụ thể của người dùng. Các ứng dụng sẽ tạo UI động dựa trên nhu cầu cụ thể của người dùng thay vì giao diện được tạo trước tĩnh.

2. Edge trở thành nhà chính cho Tác nhân Cá nhân: Tác nhân cá nhân di chuyển sang edge-đầu tiên, được thúc đẩy bởi các Mô hình Ngôn ngữ Nhỏ có khả năng chạy cục bộ trên các thiết bị chuyên dụng. Thay vì dựa vào suy luận đám mây, tác nhân cá nhân sẽ chạy cục bộ trên các thiết bị để bảo mật riêng tư, độ trễ thấp hơn, và tích hợp tốt hơn với các khả năng của thiết bị.

3. Nhà thông minh cuối cùng thực hiện lời hứa: Trợ lý nhà sẽ hiểu ngữ cảnh và ý định thay vì chỉ các lệnh trực tiếp. Chúng sẽ tích hợp tự nhiên vào Trợ lý Cá nhân như Ứng dụng Gemini hoặc ChatGPT. Thay vì “tắt đèn trong phòng khách”, bạn có thể nói “Tôi sẽ xem phim” và hệ thống tự động làm mờ đèn, đóng rèm, điều chỉnh nhiệt độ.

4. Thiết bị Tác nhân trở thành con hào mới cho các Phòng thí nghiệm AI: Các Benchmark hiện đang đạt đến bão hòa để giới thiệu cải tiến. Các phòng thí nghiệm chuyển sang “Thiết bị”, môi trường phức tạp, để hiển thị các mô hình (tác nhân) của họ có thể thực hiện quy trình công việc nhiều ngày một cách đáng tin cậy. Các Phòng thí nghiệm AI sẽ cạnh tranh về tác nhân nào có thể xử lý các tác vụ đa bước dài nhất, phức tạp nhất một cách đáng tin cậy.

5. Vibe Coding trưởng thành thành Kỹ thuật: Vai trò của kỹ sư tiếp tục phát triển. Kỹ sư sẽ dành 99% thời gian để xem xét, đánh giá, hình thành khái niệm và suy nghĩ. Năng lực cốt lõi là khả năng bắc cầu khoảng cách giữa chi tiết triển khai, chất lượng mã, vận tốc, và sự liên kết với mục tiêu kinh doanh. Biết cách viết mã sẽ là điểm bán hàng độc đáo. Hiểu biết kỹ thuật sâu trở nên quan trọng hơn để hướng dẫn các hệ thống này một cách hiệu quả. Thanh đã được nâng cao - để tách biệt mình khỏi đám đông, bạn cần nhiều hơn là chỉ sử dụng công cụ, bạn cần hiểu chúng.

6. Mạng xã hội trở nên cá nhân again: Sự tham gia của người dùng trên các nền tảng xã hội chậm lại do “AI rác” tạo ra “thị trường cao cấp” cho nội dung do con người tạo ra. Khi nội dung được tạo bởi AI tràn ngập các nền tảng, nội dung do con người tạo ra trở thành hàng hóa cao cấp. Người dùng sẽ tìm kiếm kết nối con người xác thực và sẵn lòng trả tiền cho hoặc ưu tiên tham gia với nội dung con người đã xác minh.

7. Nội dung là AI cho đến khi được chứng minh là Con người: Mặc định cho bất kỳ bài đăng nào trên X, Instagram, hoặc LinkedIn là “đây là AI.” Năm 2026 giới thiệu tiêu chuẩn siêu dữ liệu “Được ký bởi Con người”. Trừ khi bài đăng/hình ảnh mang chữ ký mật mã (C2PA cho máy ảnh), thuật toán sẽ bắt đầu giảm thứ hạng của nó như “nhiễu tổng hợp.” Các nền tảng giả định nội dung được tạo bởi AI trừ khi được chứng minh rõ ràng là do con người tạo.

8. Bằng chứng sinh trắc học về Nhân tính trở thành đăng nhập xã hội mới: Để chống lại spam tác nhân vô hạn, các nền tảng xã hội phân chia thành “Web Con người đã Xác minh” yêu cầu xác minh sinh trắc học. Tương tự như bằng chứng về nhân tính của Worldcoin, các nền tảng sẽ yêu cầu xác minh sinh trắc học (quét mống chân tay, vân tay, nhận diện khuôn mặt) để phân biệt con người khỏi tác nhân AI.

Tác giả cực kỳ hào hứng về năm 2026, không lo lắng về vai trò là kỹ sư, và tin rằng học viết mã không phải là ý tưởng tồi. Hiểu biết kỹ thuật sâu đang trở nên quan trọng hơn. Lời khuyên: “Xây dựng và học.” Nhìn kỹ những gì người khác đang xây dựng, phân công công việc của họ để hiểu “tại sao” và “như thế nào,” sau đó xây dựng các phiên bản của riêng bạn. Trực giác kỹ thuật sâu là điều sẽ phân biệt bạn.

Các tác nhân sẽ tiếp tục là tiêu đề chính. Chúng ta sẽ thấy các mô hình thiết kế thành công được thiết lập bởi các tác nhân lập trình chuyển sang các tác nhân “mục đích chung”. Chuyển sang các trường hợp sử dụng chủ động và xung quanh—nơi các tác nhân không chỉ chờ lời nhắc, nhưng tương tác trong cuộc sống hàng ngày của chúng ta để dự đoán nhu cầu.

Điểm chính:

Generative UI, Tác nhân Cá nhân Edge, và nhận thức ngữ cảnh Nhà thông minh nổi lên để trải nghiệm người dùng tốt hơn
Thiết bị Tác nhân thay thế benchmark làm con hào cạnh tranh cho các Phòng thí nghiệm AI
Vibe Coding trưởng thành: kỹ sư tập trung vào xem xét/đánh giá/hình thành khái niệm, biết mã trở thành yếu tố phân biệt
“AI rác” tạo thị trường cao cấp cho nội dung con người; các nền tảng áp dụng tiêu chuẩn siêu dữ liệu “Được ký bởi Con người”
Bằng chứng sinh trắc học về nhân tính trở thành yêu cầu để chống spam tác nhân