Website cũ lạc hậu: khi SEO chưa đủ và GEO chưa có trong kỷ nguyên AI
Người dùng đang hỏi ChatGPT, Perplexity và Google AI Overviews thay vì click link. Nếu website của bạn không được AI trích dẫn, bạn đang invisible với phần lớn người tìm kiếm mới — dù bạn đang đứng top Google.
Có một sự thật đang diễn ra chậm nhưng chắc: người dùng — đặc biệt nhóm dưới 35 tuổi — ngày càng hỏi AI trước khi (hoặc thay vì) mở Google. ChatGPT trả lời câu hỏi sản phẩm. Perplexity tổng hợp so sánh dịch vụ. Google AI Overviews đưa ra câu trả lời trực tiếp ngay trên trang kết quả mà không cần click. Trong thế giới đó, không xuất hiện trong câu trả lời AI đồng nghĩa với không tồn tại — dù bạn đang đứng #3 trên Google.
SEO truyền thống: nền tảng cần thiết nhưng chưa đủ
Hầu hết website được xây trước 2022 đều có cùng một tập lỗi SEO cơ bản:
- **Thiếu canonical URL**: nhiều trang với nội dung tương tự không khai báo trang ưu tiên — Google index tất cả, authority bị chia đều, không trang nào đủ mạnh
- **Meta description bỏ trống hoặc copy-paste**: meta description không ảnh hưởng trực tiếp ranking nhưng ảnh hưởng CTR — thiếu nó là bỏ tiền trên bàn
- **Schema.org không có hoặc sai**: Google cần structured data để hiểu "trang này là gì" — sản phẩm, dịch vụ, bài viết, tổ chức. Không có schema → Google phải đoán → đoán sai → hiển thị sai
- **H1/H2/H3 dùng bừa**: heading hierarchy không phải styling — nó là tín hiệu ngữ nghĩa. Nhiều trang dùng H2 vì nó "to hơn" thay vì vì nó là cấp 2 của nội dung
- **Sitemap không được cập nhật**: sitemap.xml sinh ra lúc deploy rồi để đó, không tự động thêm trang mới — crawler phải tự đi tìm
- **Core Web Vitals kém**: LCP trên 2.5s, CLS layout shift khi font load — Google dùng những chỉ số này như tín hiệu chất lượng từ 2021
Những lỗi này tích lũy dần. Mỗi lỗi một mình không fatal, nhưng cộng lại chúng tạo ra một website mà cả Google lẫn AI không thực sự hiểu — và không hiểu thì không trích dẫn.
GEO — khái niệm mới, áp lực cũ
GEO (Generative Engine Optimization) là tập hợp các kỹ thuật để nội dung của bạn được AI engines trích dẫn và hiển thị trong câu trả lời tổng hợp. Nó không thay thế SEO — nó ngồi trên nền SEO và yêu cầu thêm một lớp tín hiệu mà hầu hết website hiện tại hoàn toàn thiếu:
- **llms.txt**: file đặt tại `/llms.txt` để khai báo với AI crawlers nội dung nào được phép dùng, tóm tắt mục đích site, liệt kê các trang quan trọng. AI crawler của OpenAI (GPTBot), Anthropic (ClaudeBot), Perplexity (PerplexityBot) đều đọc file này.
- **robots.txt rõ ràng cho AI bots**: nhiều website chặn `*` (mọi bot) trong robots.txt mà không biết điều đó cũng chặn luôn AI crawlers. Kết quả: AI không có dữ liệu về bạn → không thể trích dẫn bạn.
- **Organization schema với đầy đủ thông tin**: AI engine cần biết "tổ chức này là ai, làm gì, đáng tin không" trước khi quyết định trích dẫn. Schema.org `Organization` với name, url, contactPoint, areaServed, knowsAbout là tín hiệu định danh quan trọng nhất.
- **Author byline và E-E-A-T signals**: AI engines — đặc biệt khi trả lời câu hỏi kỹ thuật hoặc tư vấn — ưu tiên nguồn có tác giả rõ ràng, có credential, có kinh nghiệm thực tế. Bài viết không có tên tác giả, không có ngày xuất bản, không có credential section bị xếp hạng thấp hơn trong AI ranking.
- **FAQ schema và HowTo schema**: đây là hai loại structured data AI engines đọc trực tiếp để tổng hợp câu trả lời. Có FAQ schema nghĩa là câu trả lời của bạn đã được đóng gói theo format AI có thể tái sử dụng ngay.
Hậu quả thực tế khi thiếu GEO
Không phải hậu quả giả thuyết — đây là những gì đang xảy ra:
- ChatGPT trả lời câu hỏi "công ty nào làm IoT tại Cần Thơ?" bằng cách tổng hợp từ các nguồn có structured data rõ ràng. Website không có Organization schema → không tồn tại trong câu trả lời đó, dù bạn đang làm IoT tại Cần Thơ.
- Perplexity AI Citations hiển thị 3–5 nguồn cho mỗi câu trả lời. Các nguồn được chọn dựa trên relevance, authority, và quan trọng nhất: **structured data đủ để Perplexity parse được**. Bài blog không có Article schema, không có author, không có date → bị bỏ qua.
- Google AI Overviews (Search Generative Experience) đang mở rộng tại Việt Nam. Nghiên cứu của Search Engine Land (2025) chỉ ra rằng các trang có FAQ schema và HowTo schema được featured trong AI Overviews với tần suất cao hơn 3× so với trang không có structured data.
- Dự báo của Gartner: đến 2027, 30% traffic organic search sẽ giảm do người dùng nhận câu trả lời trực tiếp từ AI mà không click link. Nhưng traffic từ AI citation sẽ tạo ra segment mới — **AI-referred traffic** với conversion rate cao hơn vì người dùng đã được AI pre-qualify thông tin.
Checklist kiểm tra nhanh
**SEO cơ bản (nền tảng):**
- [ ] Mọi trang có canonical URL không?
- [ ] Meta title + description unique cho từng trang không?
- [ ] Sitemap.xml tự động cập nhật khi có trang mới không?
- [ ] robots.txt cho phép các crawler chính không bị chặn nhầm?
- [ ] Core Web Vitals: LCP < 2.5s, CLS < 0.1?
**GEO / AI-Ready (lớp trên):**
- [ ] Có file `/llms.txt` mô tả site và liệt kê trang quan trọng không?
- [ ] robots.txt khai báo rõ GPTBot, PerplexityBot, ClaudeBot được phép không?
- [ ] Organization schema có đủ name, url, description, contactPoint, knowsAbout không?
- [ ] WebSite schema có SearchAction (potentialAction) không?
- [ ] Bài blog có Article schema với author, datePublished, wordCount không?
- [ ] Bài blog có author byline hiển thị trong UI không?
- [ ] Các trang dịch vụ có FAQ schema hoặc HowTo schema không?
Không phải làm lại từ đầu
Tin tốt: phần lớn cải tiến SEO + GEO là additive — thêm vào, không phải viết lại. Một website Next.js hoặc WordPress có thể bổ sung toàn bộ structured data, llms.txt, và robots.txt trong vài ngày làm việc, không cần đụng đến frontend hay rebuild architecture.
Tin không tốt: mỗi tháng trì hoãn là một tháng AI engines học cách không biết đến bạn — và một khi AI đã có "mental model" về một ngành dựa trên dữ liệu từ competitor của bạn, việc chen vào sau sẽ khó hơn nhiều so với việc có mặt từ đầu.
Tại lớp Development của KonexForge, SEO + GEO audit là một phần bắt buộc của mọi Pilot Build — không phải feature thêm vào cuối, mà là tiêu chí đầu ra từ ngày đầu tiên.