Ứng dụng phần mềm SPSS trong quản lý cơ sở dữ liệu

Ứng dụng của phần mềm SPSS trong quản lý cơ sở dữ liệu
Rate this post

Last updated on 28/02/2024

Giới thiệu về SPSS

Phần mềm SPSS (viết tắt của Statistical Package for the Social Sciences) là một phần mềm máy tính phục vụ công tác phân tích thống kê.

SPSS là phần mềm thống kê được sử dụng phổ biến cho các nghiên cứu điều tra xã hội học và kinh tế lượng. SPSS có giao diện thân thiện với người dùng, dễ sử dụng với các thao tác click chuột dựa trên các các công cụ (tool) mà không đòi hỏi phải dùng lệnh (khác với R hay Stata). 

Phần mềm SPSS rất mạnh cho các phân tích như kiểm định phi tham số (Chi-square, Phi, lamda…), thống kê mô tả, kiểm định sự tin cậy của thang đo bằng Cronbach Alpha, phân tích tương quan, hồi quy tuyến tính đơn và bội, kiểm định trung bình (T-test), kiểm định sự khác nhau giữa các biến phân loại (định danh) bằng phân tích phương sai (ANOVA), vẽ bản đồ nhận thức (dùng trong marketing) hay sử dụng biến giả (hồi quy với biến phân loại), hồi quy nhị thức (logistic) v.v.

Điểm mạnh của SPSS:

  • Khả năng quản lý các cơ sở dữ liệu phức tạp
  • Dễ dàng tạo thêm các biến mới từ những trường thông tin có sẵn
  • Hỗ trợ biểu diễn nhiều dạng biểu đồ
  • Có thể xử lý ngôn ngữ tiếng Việt. Đây có thể coi là ưu điểm vượt trội của SPSS so với các phần mềm phân tích khác.

Hạn chế của SPSS:

  •  Đồ họa bị hạn chế
  •  Khó khăn trong việc chỉnh sửa biểu đồ và đồ thị
  •  Chia trục tung và trục hoành tự động gây bất lợi cho việc biểu diễn các biểu đồ, đồ thị có cùng thang đo để so sánh cảm quan
  • Không thực hiện được nhiều kỹ thuật hồi quy
Phần mềm SPSS

Phần mềm SPSS

Ứng dụng của SPSS trong các lĩnh vực

Các nhà nghiên cứu sử dụng rộng rãi SPSS cho các nghiên cứu ở các lĩnh vực tiêu biểu như:

  • Nghiên cứu thị trường và Marketing: Dự định mua sản phẩm, xu hướng chấp nhận một sản phẩm, dịch vụ; định vị thương hiệu trên các thuộc tính sản phẩm, dịch vụ …
  •  Nghiên cứu trong y sinh: các ảnh hưởng của thuốc tới một nhóm bệnh lý, phân tích các yếu tố hảnh hưởng đến sâu hại nông nghiệp…
  • Điều tra xã hội học: Đánh giá chất lượng dịch vụ công, xác định các yếu tố ảnh hưởng đến cảm nhận của người dân v.v.
  • Dự báo
  • Nghiên cứu học thuật

Đối với Công ty Tư vấn Quản lý OCD, SPSS là một trong những công cụ phân tích dữ liệu đắc lực, được sử dụng trong các dự án Tư vấn chiến lược và Nghiên cứu thị trường. Có thể kể đến một dự án lớn điển hình như “Đánh giá mức độ hài lòng của khách hàng sử dụng điện đối với Tập đoàn Điện lực Việt Nam”. Dự án được thực hiện trên 62 tỉnh/thành phố (trừ TP. Hồ Chí Minh) với số lượng phiếu khảo trung bình lên đến 35.000 phiếu mỗi năm.

Mỗi phiếu khảo sát bao gồm khoảng 40 tiêu chí đánh giá và số lượng lớn các thông tin về nhân khẩu học. Có thể thấy cơ sở dữ liệu của dự án EVN khá lớn và được biểu diễn bằng ngôn ngữ tiếng Việt, tuy nhiên, SPSS vẫn dễ dàng quản lý và xử lý cơ sở dữ liệu này.

Sử dụng SPSS trong quản lý cơ sở dữ liệu

Cơ sở dữ liệu được hiểu theo cách định nghĩa kĩ thuật là một tập hợp thông tin có cấu trúc. Những khối lượng thông tin khổng lồ đều sẵn có trong môi trường kinh tế và xã hội ngày nay nhờ những tiến bộ liên tục trong công nghệ thông tin. Để phát triển kinh tế và thay đổi xã hội, các nhà nghiên cứu và quản lý phải có khả năng hiểu được thông tin và quản lý thông tin một cách hiệu quả. Dưới đây, bài viết sẽ trình bày những thao tác cơ bản đầu tiên trong quá trình quản lý dữ liệu bằng phần mềm SPSS

Tạo cơ sở dữ liệu với SPSS

Phần mềm SPSS có tất cả 4 dạng màn hình

  • Màn hình quản lý dữ liệu (data view): Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
  • Màn hình quản lý biến (variables view): Là nơi quản lý các biến cùng với các thông số liên quan đến biến
  • Màn hình hiển thị kết quả (output): cho phép ta xem và lưu giữ các kết quả phân tích (có đuôi là .SPO)
  • Màn hình cú pháp (syntax): cho phép ta xem và lưu trữ  những cú pháp của một lệnh phân tích

co-so-du-lieu-ooc

Khai báo biến trong SPSS

  • Variable Name (tên biến): Các qui tắc dưới đây được áp dụng cho tên biến:
  1.  Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
  2.  Tên biến không được kết thúc bằng một dấu chấm.
  3. Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới (để tránh xung đột với các biến được tự động lập bởi một số thủ tục)
  4.  Độ dài của tên biến không nên vượt quá 8 ký tự.  Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng
  5. Tên biến phải duy nhất (không được phép trùng lặp), không được dùng chữ hoa để đặt tên biến. Các tên NEWVAR, NewVar, và newvar được xem là giống nhau.
  • Lebels (nhãn biến): dùng để giải thích rõ ý nghĩa của từng biến và hiển thị kết quả khi chạy dữ liệu
  • Value (giá trị của từng mã hóa): dùng để giải thích rõ ý nghĩa từng giá trị và hiển thị kết quả khi chạy dữ liệu
  • Missing (giá trị khuyết thuyết): dùng để loại những giá trị không có ý nghĩa. Các giá trị khuyết sẽ không tham gia vào quá trình phân tích
  • Measure (thang đo): SPSS phân ra 3 loại thang đo

spss-ooc

  1. Nominal (thang đo định danh)
  2. Ordinal (thang đo thứ bậc)
  3. Scale (thang đo khoảng và thang đo tỷ lệ)
  • Width (xác định số lượng ký tự hiển thị cho giá trị)
  • Decimals (số lượng con số sau dấu phẩy hiển thị)
  • Column format (định kích cỡ cho cột)
  • Align (định ra vị trí hiện các giá trị)

Thông tin

Nguồn: Bà Phạm Linh Chi – chuyên gia  nghiên cứu và phân tích dữ liệu của OCD

Bà Phạm Linh Chi là chuyên gia trong lĩnh vực nghiên cứu và phân tích dữ liệu của OCD, chuyên sâu trong việc thực hiện các nghiên cứu định lượng. Bà Chi có nhiều kinh nghiệm triển khai các dự án nghiên cứu, điều tra khảo sát quy mô lớn với các nhiệm vụ đa dạng như thiết kế bộ công cụ, tổ chức và quản lý nhóm khảo sát, thu thập số liệu tại thực địa, phân tích số liệu và tham gia viết báo cáo v.v.

Đọc thêm:  Quản lý dữ liệu là gì? Tầm quan trọng của quản lý dữ liệu đối với tổ chức, doanh nghiệp

5 xu hướng nghiên cứu thị trường nổi bật năm 2020

Contact Us