Cách hoạt động của Google Analytics

Posted on 08/11/2009

1


Các công cụ phân tích web có 1 số phương pháp thu thập dữ liệu người dùng cơ bản. Cổ xưa nhất là phương pháp truy cập nhật kí tương tác giữa người dùng và website (log file) được lưu trên server của website đó. Các công cụ phân tích web khai thác dữ liệu theo cách này (Awstats, Weblog Expert, …) sẽ truy cập vào server của website và tổng hợp nhật kí web rồi hiển thị cho người phân tích theo 1 cách rõ ràng, dễ nhìn, dễ sử dụng.

Google Analytics thì không thuộc dạng công cụ phân tích logfile. Google Analytics theo phương pháp thu thập dữ liệu thông qua trình duyệt. Ngay khi người dùng tương tác với website bằng trình duyệt của họ thì trình duyệt sẽ gửi các thông tin tương tác đó về cho Google Analytics. Trình duyệt của người dùng thực hiện các thao tác gửi thông tin này theo mệnh lệnh của 1 đoạn code “chỉ thị” (dạng javascript) được gắn trên website. Do đó, phương pháp này được gọi là Javascript tagging.

Thế thì sau khi về đến tay Google, các dữ liệu này sẽ đi tiếp như thế nào trong ‘nhà máy’ của Google Analytics?

Google Analytics platform

1 bộ phận gọi là GA collector sẽ nhận các dữ liệu đó và nó sẽ lưu trữ chúng dưới dạng các cú “hit” riêng lẻ và các “session” của các “hit” đó. Ở đây, chúng được lưu trữ gần như là 1 bộ cơ sở dữ liệu (database) nhưng theo một cách cho phép xử lý và tính toán phân phối hiệu quả nhất (efficient processing & distributed computation).

Sau đó, họ sẽ tính toán trước các dữ liệu này để cho ra các bảng, cột, các báo cáo mà họ nghĩ rằng người dùng sẽ quan tâm nhất để chúng sẵn có cho người dùng xem chỉ trong tic tắc sau 1 cái click chuột. Vì vậy, khi người dùng thực hiện 1 yêu cầu trên giao diện (UI – user interface) của Google Analytics, thì yêu cầu đó sẽ được gửi về cho Query Engine (trên hình là ? Engine) của Google Analytics. Query Engine biết rõ phải tìm dữ liệu ở đâu (ở các dữ liệu tính toán sẵn hay ở bộ dữ liệu thô) là nhanh nhất để thõa mãn yêu cầu của người dùng. Nó tìm và đáp trả lại thông tin cho người dùng trên giao diện của GA.

Trong các chức năng của GA có chức năng Custom Report giúp người dùng tự đưa ra các kiểu báo cáo theo ý mình, ngoài các báo cáo có sẵn của GA. Khi người dùng thực hiện chức năng này, thì nó cũng sẽ gửi yêu cầu về Query Engine. Lúc này Query Engine cũng sẽ tìm trên các dữ liệu tính toán sẵn, nếu không có, chúng sẽ được chuyển qua bộ dữ liệu thô rồi tính toán xếp thành bảng cột, trả kết quả lại cho người dùng. Do đó ta thấy với các bảng báo cáo Custom Report, thời gian xử lý có khi lâu hơn 1 chút hoặc nhiều tùy theo mức độ phức tạp của yêu cầu.

Đến phiên Export API cũng có cùng 1 khả năng truy cập vào Query Engine và cùng khả năng thọc sâu vào nhiều khu vực dữ liệu khác nhau. Tuy nhiên với API, người dùng sẽ không gắn kết với các kiểu bảng cột hay giao diện sẵn có của GA mà lấy dữ liệu từ GA về để tích hợp với cách tính toán thống kê riêng, hoặc với 1 giao diện của riêng. Từ đó họ có khả năng giải quyết những câu hỏi mà Custom Report hoặc basic UI Report chưa trả lời rõ ràng được cho họ.

Xem thêm:

Google Analytics thu thập thông tin như thế nào?