Bỏ qua

Bảng Thuật Ngữ Nghiệp Vụ (Business Glossary)

Mục đích: Kho tập trung các thuật ngữ nghiệp vụ, từ viết tắt và khái niệm chuyên ngành được sử dụng trong tất cả tài liệu BA của dự án.

Cập nhật lần cuối: 2026-03-24 Dự án: Nền tảng Quản lý, Quản trị Dữ liệu Thành phố


📖 Thuật Ngữ Nghiệp Vụ

Thuật Ngữ Định Nghĩa Sử dụng trong Từ đồng nghĩa
Domain Lĩnh vực phân loại dữ liệu cấp cao nhất. Đại diện cho một chủ thể/đối tượng quản lý lớn của Thành phố (VD: Con người, Tổ chức, Đất đai). Không chứa data thực tế, chỉ là nhãn phân loại. Business Understanding Subject Area, Data Domain
Sub Domain Phân nhóm trong một Domain, chia nhỏ theo khía cạnh cụ thể hơn của cùng chủ thể (VD: Domain "Con người" → Sub Domain "Định danh", "Y tế & Sức khỏe"). Business Understanding Data Subject Area, Data Category, Data Topic
Data Element Đơn vị metadata nhỏ nhất được quản lý trong hệ thống. Mỗi Data Element định nghĩa một trường dữ liệu gồm: tên, mô tả, kiểu dữ liệu, mã định danh và đơn vị chủ quản. Hệ thống lưu định nghĩa của Data Element, không lưu giá trị thực tế. Business Understanding Data Attribute, Metadata Element, Data Field Definition
Anchored Data Khung dữ liệu định vị – tập hợp các Domain, Sub Domain và Data Element được khai báo từ đầu dựa trên quy định Chính phủ/Bộ/Ngành và thực tiễn địa phương. Đây là chuẩn tham chiếu để mapping dữ liệu từ các đơn vị. Business Understanding Baseline Data, Reference Data Framework
Data Ownership Nguyên tắc mỗi Data Element chỉ có một đơn vị chủ quản duy nhất (Quy tắc 1:1), gán đến cấp Phòng/Ban (mã IDxx.xx.xx) trên trục dọc cây tổ chức, không chỉ cấp Sở. Đơn vị chủ quản chịu trách nhiệm về chất lượng, chuẩn hóa và chia sẻ Data Element đó. Data Element không có Sở nào lưu trữ → ghi nhận "Dữ liệu cần xây dựng mới" (owner = NULL). Business Understanding Data Stewardship (khái niệm, không phải role — xem Q10: role Data Steward đã bỏ, dùng Manager thay thế), Quy tắc 1:1
Data Dictionary Từ điển dữ liệu – giao diện tra cứu công khai toàn bộ metadata đã được quy hoạch. Cho phép nhà thầu và cán bộ tìm kiếm loại dữ liệu nào đã có định nghĩa, tránh xây dựng trùng lắp. Business Understanding Từ điển Dữ liệu, Metadata Catalog
Bản đồ dữ liệu hiện trạng Ma trận thể hiện mối quan hệ giữa các Data Element (hàng) và các đơn vị Sở/Ban/Ngành (cột), chỉ rõ đơn vị nào đang lưu trữ Data Element nào và trạng thái (chồng chéo, phân mảnh, sẵn sàng kết nối). Business Understanding Current State Data Map
Confident Score Điểm tin cậy do AI gán cho mỗi gợi ý mapping Data Element. Giai đoạn hiện tại: mọi gợi ý phải human review bất kể score. Tương lai có thể enable auto-accept khi vượt ngưỡng threshold. Mọi quyết định ghi vào ai_feedback_log. Business Understanding Confidence Score, Similarity Score
Metadata Thông tin mô tả về dữ liệu – bao gồm tên trường, kiểu dữ liệu, mô tả ý nghĩa, đơn vị chủ quản, hệ thống lưu trữ. Hệ thống này chỉ quản lý metadata, không quản lý data thực tế. Business Understanding Siêu dữ liệu
~~Term~~ Không sử dụng trong tài liệu dự án. Thuật ngữ "Term" xuất hiện trong SRS v1.3 của Tech Lead, chỉ cùng khái niệm với Data Element. Dự án thống nhất dùng "Data Element" ở mọi giai đoạn — phân biệt bằng trạng thái (DRAFT→PUBLISHED) và mức độ hoàn thiện thuộc tính, không đặt tên khác. Mapping SRS v1.3 → Dùng Data Element
Sensitivity Level Phân loại mức độ nhạy cảm của Data Element, ảnh hưởng đến quyền truy cập và hiển thị. 4 mức: PUBLIC (công khai), INTERNAL (nội bộ, cần đăng nhập), CONFIDENTIAL (bảo mật, hạn chế truy cập), SECRET (tối mật, kiểm soát chặt). SRS v1.3 Mức độ nhạy cảm, Data Classification

🌐 Mapping Khái Niệm Với Chuẩn Quốc Tế

Bảng này ánh xạ 3 khái niệm cốt lõi của hệ thống với các thuật ngữ tương đồng trong ISO 11179DAMA DMBOK để đảm bảo nhất quán khi trao đổi với các bên liên quan quốc tế hoặc khi tham chiếu tài liệu chuẩn.

Domain

Chiều Nội dung
Tên dùng trong dự án Domain
ISO 11179 Data Domain – nhóm phân loại các Data Element có liên quan về mặt nghiệp vụ. ISO 11179 không đặt ra cấu trúc phân cấp cứng; Domain là một cách tổ chức tùy chọn trong Metadata Registry.
DAMA DMBOK Subject Area – phân vùng nghiệp vụ lớn nhất dùng để nhóm các Data Entity có liên quan. Tương đương với "Data Domain" trong một số tài liệu DAMA.
Nhận xét Ba thuật ngữ đều chỉ cùng một khái niệm phân loại cấp cao. "Domain" được dùng trong dự án vì ngắn gọn và phổ biến trong các công cụ Data Catalog (Collibra, Alation, DataHub).

Sub Domain

Chiều Nội dung
Tên dùng trong dự án Sub Domain
ISO 11179 Data Subject Area – phân vùng con trong một Data Domain. ISO 11179 cho phép phân cấp lồng nhau tùy ý trong Metadata Registry.
DAMA DMBOK Data Category hoặc Data Topic – phân nhóm trung gian giữa Subject Area và Data Entity/Attribute. DMBOK không cố định tên gọi cho cấp này; có thể gọi là Sub-Subject Area.
Nhận xét "Sub Domain" là tên phổ biến trong thực tế triển khai. Tuy nhiên, "Data Subject Area" (ISO 11179) hoặc "Data Category" (DAMA) có thể được dùng thay thế khi cần giao tiếp chuẩn hóa với bên ngoài.

Data Element

Chiều Nội dung
Tên dùng trong dự án Data Element
ISO 11179 Data Element – đây chính xác là thuật ngữ gốc của ISO 11179. Định nghĩa: "a unit of data for which the definition, identification, representation, and permissible values are specified by means of a set of attributes." Mỗi Data Element có: tên, định nghĩa, kiểu dữ liệu, miền giá trị và identifier duy nhất.
DAMA DMBOK Data Attribute – thuộc tính nhỏ nhất của một Data Entity có thể định nghĩa và quản lý độc lập. Tương đương với Data Element nhưng thường gắn với một Entity cụ thể hơn.
Nhận xét "Data Element" là lựa chọn chính xác nhất cho dự án này vì: (1) ISO 11179 là chuẩn trực tiếp cho Metadata Registry, (2) Chính phủ Việt Nam dùng "Thành phần dữ liệu" = Data Element trong các văn bản kỹ thuật về dữ liệu quốc gia.

🔤 Từ Viết Tắt & Chữ Viết Tắt

Viết tắt Đầy đủ Định nghĩa Ngữ cảnh
DE Data Element Đơn vị metadata nhỏ nhất trong hệ thống (VD: DE001-DM1.1) Mã định danh Data Element
DM Domain Lĩnh vực phân loại cấp cao (VD: DM1: Con người) Mã định danh Domain
SSO Single Sign-On Cơ chế đăng nhập một lần, dùng chung tài khoản của hệ thống Tỉnh/Thành phố Xác thực người dùng
ETL Extract, Transform, Load Thuật ngữ ETL truyền thống không áp dụng chính xác cho dự án này. Trong Discovery, hệ thống chỉ trích xuất metadata cấu trúc (schema), không di chuyển data thực tế. Xem: "Schema Extraction" Từ viết tắt cần tránh dùng trong tài liệu dự án
Schema Extraction Quá trình trích xuất danh sách field names và kiểu dữ liệu từ file CSV (parse header) hoặc SQL DDL (parse CREATE TABLE). Kết quả là danh sách metadata cấu trúc của một đơn vị, sẵn sàng cho bước matching. Chức năng Discovery (bước 02)
Field Matching Quá trình đối chiếu field names đã trích xuất từ đơn vị với các Data Element trong khung Anchored Data. Sử dụng kết hợp rule-based matching và AI. Kết quả: Match (đơn vị đang lưu trữ DE đó) hoặc Không match (field nội bộ hoặc cần bổ sung DE mới). Đây là chức năng quan trọng nhất của hệ thống. Chức năng Discovery (bước 03a)
AI Artificial Intelligence Trí tuệ nhân tạo – dùng trong Field Matching để gợi ý đối chiếu field với Data Element dựa trên ngữ nghĩa và pattern recognition Bước xây dựng bản đồ hiện trạng
KHCN Khoa học và Công nghệ Sở Khoa học và Công nghệ – đơn vị Manager có thể thuộc về Actors
CSDL Cơ sở dữ liệu Database của các Sở/Ban/Ngành mà hệ thống Discovery đọc metadata cấu trúc Discovery

🏷️ Giá Trị Trạng Thái

Trạng thái vòng đời quy hoạch dữ liệu

⚠️ Các trạng thái này là đề xuất tham khảo, chưa được chốt chính thức.

Giá trị Ý nghĩa Quy tắc chuyển đổi
DRAFT Dữ liệu định vị đã được khai báo, chưa gửi đi xác nhận IN_REVIEW khi Manager hoàn thành bước 03a (AI mapping)
IN_REVIEW Đang trong quá trình mapping và xác nhận bởi Manager và Data Owner APPROVED khi Approver đồng ý; → quay lại DRAFT khi Approver từ chối
APPROVED Approver đã chốt quyền sở hữu 1:1 cho tất cả Data Element PUBLISHED khi Approver ban hành chính thức
PUBLISHED Từ điển Dữ liệu chuẩn đã được công bố, Staff có thể tra cứu Trạng thái cuối – cần quy trình riêng để cập nhật/thu hồi

Trạng thái bổ sung — ghi nhận cho giai đoạn sau

Các trạng thái dưới đây chưa triển khai trong giai đoạn hiện tại. Ghi nhận từ SRS v1.3 để đảm bảo thiết kế tương thích khi mở rộng.

Giá trị Ý nghĩa Khi nào cần
PENDING_DISCOVERY Agent tự động phát hiện field mới từ CSDL đơn vị — chưa có chủ quản Khi triển khai Discovery tự động (LDOP, Agent cron)
SURVEYED Seed từ Bảng D — đã có chủ quản, chưa có định nghĩa đầy đủ. Cầu nối P0→P1 Khi triển khai P1 (quản lý nội dung từ điển)
DEPRECATED Lỗi thời, giữ tương thích ngược — vẫn hiển thị nhưng đánh dấu "không còn khuyến nghị" Khi cần quản lý vòng đời dài hạn
ARCHIVED Lưu trữ vĩnh viễn, không hiển thị cho tra cứu Sau DEPRECATED (tự động hoặc thủ công)

Vòng đời đầy đủ (giai đoạn sau): PENDING_DISCOVERY → SURVEYED → DRAFT → IN_REVIEW → APPROVED → PUBLISHED → DEPRECATED → ARCHIVED


Nhật Ký Cập Nhật

Ngày Thay đổi Tài liệu ảnh hưởng
2026-03-24 Tạo mới – bổ sung 8 thuật ngữ nghiệp vụ cốt lõi, mapping ISO 11179 / DAMA DMBOK cho Domain / Sub Domain / Data Element, từ viết tắt và trạng thái vòng đời Business Understanding