Khai báo biến (hay còn gọi là mã hóa) và nhập liệu là những bước đầu tiên để có bộ dữ liệu mà SPSS có thể hiểu và thực hiện được các phân tích thống kê. Bài viết sẽ hướng dẫn chi tiết ý nghĩa các thuộc tính của biến và thao tác khai báo biến, nhập liệu trong SPSS.

Bạn đang xem: Cách mã hóa dữ liệu trong spss

 

1. Khai báo biến

Sau khi khởi động SPSS, nhấp chuột vào cửa sổ Variable View để chuyển sang màn hình khai báo biến. Mỗi biến được tạo ra trên 1 dòng, các cột trên dòng thể hiện các thuộc tính của biến (Hình 1).

*

Hình 1. Cửa số Variable View để khai báo biến

Các thuộc tính của biến bao gồm:

- Name (tên biến): độ dài không quá 8 ký tự hay ký số, không có ký tự đặc biệt và không bắt đầu bằng ký số, gõ trực tiếp tên biến vào ô trong cột Name.

- Type (kiểu biến): mặc định chương trình sẽ chọn kiểu định lượng (Numberic). Các kiểu biến bao gồm:

Numeric: các giá trị được nhập vào và hiển thị ở dạng chữ số.Comma: các giá trị số có dấu phẩy (,) được chèn vào giữa những nhóm ba chữ số để phân biệt hàng nghìn, hàng triệu… Chúng ta chỉ nhập dữ liệu mà không cần chèn (,) SPSS tự động hiển thị giá trị có ngăn cách bằng (,). Ví dụ 1000000 = 1,000,000Dot: tương tự kiểu Comma, nhưng sử dụng dấu chấm (.) để ngăn cách giữa những nhóm ba chữ số và dấu phẩy được dùng cho chữ số hàng thập phân. Ví dụ 1000000,9999 = 1.000.000,9999Scientific Notation: kiểu biến dùng ký tự E để hiển thị chữ số mũ. Cơ số được viết bên trái chữ E, số mũ được viết bên phải chữ E. Ví dụ số 2021 được viết 2.021E3, số 0.0005 được viết 5E-4.Date: kiểu biến thời gian bao gồm năm, tháng, ngày, giờ, phút, giây. Dữ liệu hiển thị tùy thuộc vào định dạng có sẵn trong SPSS mà ta chọn.Dollar: giá trị của số liệu được hiển thị với một dấu dollar ($) phía trước, dấu chấm ngăn cách hàng thập phân và dấu phẩy ngăn cách nhóm ba chữ số để phân biệt hàng nghìn, hàng triệu... Chúng ta chỉ nhập dữ liệu mà không cần chèn ký tự dollar ($), SPSS sẽ tự động hiển thị ký tự này.Custom Currency: Năm định dạng tùy chỉnh cho tiền tệ được đặt tên CCA, CCB, CCC, CCD và CCE. Chúng ta có thể xem và tuỳ chỉnh định dạng này bằng cách vào Edit➪Options sau đó chọn thẻ Currency.
String: định dạng kiểu ký tự, không dùng để tính toán. Kiểu định dạng này không giới hạn số ký tự nhập vào, thường được sử dụng cho biến mô tả.Restricted Numeric (integer with leading zeros): giống kiểu biến Numeric tuy nhiên số chữ số được hiển thị trên SPSS là bằng nhau, những số liệu nhập vào mà ít hơn số ký tự được hiển thị thì SPSS mặc định thêm vào chữ số 0 phía trước đến khi đủ số ký tự như khai báo (số ký tự được khai báo trong thuộc tính Width).

Muốn thay đổi kiểu biến, độ rộng của biến (Width) hoặc số chữ số thập phân (Decimal Places), ta nhấn chuột vào nút … trong ô Type.

*

Hình 2. Khai báo thuộc tính Type của biến

- Width (độ rộng của biến): số ký số hay ký tự tối đa có thể nhập vào.

- Decimals: số lẻ sau dấu phẩy.

- Label (nhãn của biến): câu mô tả để giải thích ý nghĩa của biến, cần ngắn gọn.

- Values: là thuộc tính quan trọng nhất để mã hóa thang đo định tính, các thông tin thu thập từ thang đo định lượng đã ở dưới dạng số và có ý nghĩa nên không cần mã hóa.

Ví dụ: Xin vui lòng cho biết giới tính của anh/chị?

1. Nữ 2. Nam

Để thực hiện mã hóa cho câu hỏi trên, ta thực hiện các bước sau:

Bước 1: Nhấn chuột vào nút …của ô trên cột Values, hộp thoại khai báo Value Labels sẽ xuất hiệnBước 2: Nhập các giá trị Value (mã hóa các thang đo định tính) và Label (nhãn giải thích ý nghĩa của mã số đã nhập)Bước 3: Nhấn nút AddBước 4: Tiếp tục khai báo cho các giá trị mã hóa còn lại trong câu hỏi, sau đó bấm OK

*

Hình 3. Khai báo thuộc tính Values của biến

- Missing: khai báo các loại giá trị khuyết. Ví dụ, với câu hỏi giới tính, vì lý do nào đó người được điều tra từ chối trả lời, trong hộp Value labels, ta quy ước giá trị 99 có nhãn là “không trả lời”, sau đó ở cột Missing ta phải khai báo 99 là giá trị khuyết, khi thực hiện tính toán, phần mềm sẽ loại giá trị khuyết để có kết quả hợp lí. Cách đặt con số đại diện cho Missing value cần căn cứ vào ngữ cảnh và sự lựa chọn của người xử lý (ví dụ, nếu chọn 99 làm Missing value cho biến độ tuổi có thể gây nhầm lẫn khi cuộc điều tra có người trả lời đạt 99 tuổi, trong trường hợp này ta có thể chọn con số khác như 999 hay -100…)

*

Hình 4. Khai báo thuộc tính Missing của biến

- Columns: khai báo độ rộng của biến khi nhập liệu, thường chọn 8.

- Align: vị trí dữ liệu được nhập trong cột, thường chọn Right.

*

Hình 5. Khai báo loại thang đo của biến

Sau khi tạo xong một biến, xuống dòng để tạo các biến khác theo những bước như trên. Đối với câu hỏi có một lựa chọn, chỉ cần tạo một biến để nhập liệu câu trả lời. Trong trường hợp câu hỏi có nhiều lựa chọn, cần tạo nhiều biến, số lượng biến cần tạo bằng số lựa chọn của người trả lời có nhiều lượt chọn nhất. Ví dụ, có 3 người trả lời cho một câu hỏi, người thứ nhất có 2 lựa chọn, người thứ hai có 3 lựa chọn, người thứ ba có 5 lựa chọn thì số biến cần tạo cho câu hỏi trên là 5 biến.

 

2. Nhập liệu

Ví dụ: Có 5 người trả lời 3 câu hỏi bên dưới:

Câu 1. Xin vui lòng cho biết giới tính của Anh/Chị?

1. Nữ 2. Nam

Câu 2. Xin vui lòng cho biết thu nhập hàng tháng của Anh/ Chị ? …………………..triệu đồng

Câu 3. Xin vui lòng cho biết các loại báo mà Anh/Chị thường hay đọc?

Sài Gòn Giải PhóngThanh NiênTuổi TrẻTiền PhongVNExpressCafebizKhác

Kết quả trả lời như sau:

*

Tiến hành khai báo biến cho các câu hỏi theo những bước trong phần khai báo biến

*

Hình 6. Khai báo biến cho các câu hỏi ví dụ

Sau khi thực hiện khai báo các biến ở cửa số Variable View, ta chuyển qua cửa sổ Data View, tiến hành nhập số liệu vào SPSS cho từng biến.

Xem thêm: Tập 6 - Trận Đấu Định Mệnh

*

Hình 7. Khai báo biến cho các câu hỏi ví dụ

Sau khi khai báo biến và nhập liệu, ta có file dữ liệu SPSS để tiếp tục thực hiện các phân tích cần thiết khác (như thống kê tần suất, đánh giá độ tin cậy của thang đo, phân tích nhân tố, phân tích hồi quy…)

Như Hà

 

 

---------------------------------------------------------------------------------------------------

QUÝ ANH/CHỊ CẦN HỖ TRỢ XỬ LÝ, PHÂN TÍCH DỮ LIỆU VUI LÒNG GỬI THÔNG TIN QUA FORM DƯỚI ĐÂYCHÚNG TÔI SẼ LIÊN HỆ VÀ PHÚC ĐÁP TRONG THỜI GIAN SỚM NHẤT