조사표본

Survey sampling

통계학에서 조사 표본 추출은 조사를 수행하기 위해 대상 모집단에서 요소의 표본을 선택하는 과정을 설명합니다."조사"라는 용어는 많은 다른 유형의 관측 또는 기법을 나타낼 수 있다.설문 표본 추출에서는 대부분 사람들의 특성 및/또는 태도를 측정하는 데 사용되는 설문지를 포함한다.표본의 구성원을 선택한 후 접촉하는 다양한 방법이 설문조사 데이터 수집의 대상입니다.표본 추출의 목적은 전체 대상 모집단을 조사하는 데 필요한 비용 및/또는 작업량을 줄이는 것이다.전체 대상 인구를 측정하는 조사를 인구 조사라고 합니다.표본은 정보를 얻을 수 있는 모집단의 그룹 또는 섹션을 말한다.

조사 샘플은 크게 확률 샘플과 슈퍼 샘플의 두 가지 유형으로 나눌 수 있습니다.확률 기반 표본은 지정된 확률(적응 절차에서 지정된 적합 확률)을 가진 표본 추출 계획을 구현합니다.확률 기반 표본 추출을 사용하면 대상 모집단에 대한 설계 기반 추론을 수행할 수 있습니다.추론은 연구 프로토콜에 지정된 알려진 객관적 확률 분포를 기반으로 합니다.확률 기반 조사의 추론은 여전히 많은 유형의 편견으로 인해 어려움을 겪을 수 있다.

확률 표본 추출에 기초하지 않은 조사는 치우침이나 표본 [1]추출 오류를 측정하는 데 더 큰 어려움을 겪는다.비확률 표본에 기초한 조사는 종종 대상 [2]모집단의 사람들을 나타내지 못한다.

학술 및 정부 조사 연구에서 확률 표본 추출은 표준 절차입니다.미국의 경우, 관리예산국의 "통계조사를 위한 표준 목록"은 연방정부에서 후원하는 조사를 수행해야 한다고 명시하고 있다.

일반적으로 허용되는 통계적 방법(예: 표본오차의 추정치를 제공할 수 있는 확률론적 방법)을 사용하여 표본을 선택한다.비확률 표본 추출 방법(예: 컷오프 표본 또는 모델 기반 표본)의 사용은 통계적으로 정당화되어야 하며 추정 [3]오류를 측정할 수 있어야 한다.

랜덤 샘플링 및 설계 기반 추론은 모델 지원 샘플링 및 모델 기반 [4][5]샘플링과 같은 다른 통계 방법으로 보완된다.

예를 들어, 많은 설문조사는 상당한 양의 무응답이 있다.단위는 처음에 알려진 확률로 선택되지만, 무응답 메커니즘은 알려져 있지 않습니다.실질적인 무응답 조사의 경우, 통계학자들은 데이터 세트를 분석하는 데 사용하는 통계 모델을 제안했다.

조사 표본 추출과 관련된 문제는 Salant와 Dillman(1994)[6]을 포함한 여러 소스에서 논의된다.

확률 표본 추출

확률 표본("과학적인" 또는 "랜덤" 표본이라고도 함)에서 대상 모집단의 각 구성원은 [7]표본에 포함될 확률이 0이 아닌 알려진 확률을 가집니다.확률 표본에 기초한 조사는 이론적으로 다음과 같은 대상 모집단의 통계적 측정을 산출할 수 있다.

  • 치우침이 없는 표본 평균의 기대값은 모집단 평균 E(θ)=μ와 같다[8].
  • 신뢰 구간 또는 오차 [9]한계로 표현될 수 있는 측정 가능한 표본 오차가 있습니다.

확률 기반 조사 샘플은 샘플링 프레임이라고 불리는 대상 모집단의 리스트, 표본 프레임에서 단위를 선택하는 랜덤화 프로세스(선택 절차) 및 데이터 수집 방법 또는 [10]모드라고 불리는 선택된 단위를 접촉하는 방법을 구성함으로써 작성된다.예를 들어 급여 목록을 사용하여 회사의 직원을 표본으로 추출하는 등 일부 대상 모집단의 경우 이 프로세스가 쉬울 수 있습니다.그러나 대규모 무질서한 모집단에서 단순히 적절한 샘플 프레임을 구축하는 것은 복잡하고 비용이 많이 드는 작업인 경우가 많다.

미국에서 가구 인구의 확률 샘플을 실시하는 일반적인 방법은 지역 확률 샘플링, 랜덤 디짓 다이얼 전화 샘플링, 그리고 최근에는 주소 기반 [11]샘플링이다.

확률 표본 추출에는 확률 표본 추출의 기본 원칙을 변경하지 않고 표본 추출 프로세스의 정밀도 또는 효율성을 향상시키는 계층화 표본 추출 및 클러스터 표본 추출과 같은 전문 기술이 있습니다.

계층화는 표본 추출 전에 각 표본 단위에 대한 보조 정보를 기반으로 모집단의 구성원을 균질한 하위 그룹으로 나누는 과정이다.계층은 상호 배타적이어야 합니다. 모집단의 모든 요소는 하나의 계층에만 할당되어야 합니다.지층은 또한 집단적으로 포괄적이어야 한다. 즉, 모집단 요소를 배제할 수 없다.그런 다음 간단한 무작위 샘플링 또는 체계적인 샘플링과 같은 방법을 각 계층 내에서 적용할 수 있습니다.계층화는 표본 오차를 줄임으로써 표본의 대표성을 향상시키는 경우가 많습니다.

확률 표본 추출의 치우침

조사의 편향은 바람직하지 않지만 종종 피할 수 없다.샘플링 프로세스에서 발생할 수 있는 주요 바이어스 유형은 다음과 같습니다.

  • 무응답 바이어스:조사 표본에서 선택된 개인이나 가구가 조사를 완료할 수 없거나 완료할 수 없는 경우, 이러한 무응답으로 인해 편향이 발생할 가능성이 있다.무응답 편향은 응답자와 비응답자 [12]간의 차이로 인해 관측값이 모집단 모수에서 벗어날 때 발생합니다.
  • 반응 바이어스:이것은 무응답 편향의 반대는 아니지만, 다양한 이유로 부정확하거나 거짓된 답변을 할 수 있는 응답자들의 성향과 관련이 있다.
  • 선택 바이어스:선택 편향은 일부 단위가 연구자에 의해 설명되지 않은 선택 확률을 가질 때 발생합니다.예를 들어, 일부 가구는 여러 개의 전화번호를 가지고 있기 때문에 전화번호가 하나만 있는 가구보다 전화 설문조사에서 선택될 가능성이 더 높다.이러한 선택편향은 [1/(전화번호 번호 번호)]에 해당하는 조사 가중치를 각 가구에 적용하여 수정될 것이다.
  • 자체 선택 바이어스:개인이 자발적으로 자신을 그룹으로 선택함으로써 잠재적으로 해당 그룹의 응답을 편향시키는 편견의 한 유형입니다.
  • 참가편향:조사 또는 여론조사에 참여하기로 선택한 사람들의 특성으로 인해 발생하는 편견입니다.
  • 커버리지 바이어스:커버리지 바이어스는 모집단 멤버가 샘플프레임에 표시되지 않는 경우(커버리지 부족) 발생할 수 있습니다.커버리지 바이어스는 대상 단위와 비대상 단위 간의 차이로 인해 관측값이 모집단 매개변수를 벗어날 때 발생합니다.전화 조사는 전화가 없는 가구를 포함할 수 없기 때문에 커버리지 편중으로 인해 어려움을 겪는다.

비확률 표본 추출

많은 설문조사는 확률표본이 아니라 설문조사를 완료하기 위한 적절한 응답자 집단을 찾는 데 기초한다.비확률 샘플링의 일반적인 예는 다음과 같습니다.[13]

  • 판단 샘플:연구자는 자신의 판단에 따라 표본에 포함할 모집단 구성원을 결정합니다.연구자는 표본의 대표성에 대한 몇 가지 대체 근거를 제공할 수 있다.기초적인 가정은 조사자가 모집단의 특성을 나타내는 단위를 선택할 것이라는 것이다.이 방법은 연구자의 편견과 [14]인식의 대상이 될 수 있다.
  • 눈덩이 표본: 목표 모집단이 드물 때 자주 사용됩니다.대상 모집단의 구성원은 조사를 위해 모집단의 다른 구성원을 모집한다.
  • 쿼터 샘플:이 샘플은 특정 특성을 가진 지정된 수의 사람을 포함하도록 설계되어 있습니다.예를 들어, 100명의 커피를 마시는 사람들.이러한 유형의 표본 추출은 비확률 시장 조사에서는 흔히 볼 수 있다.
  • 편리한 샘플:샘플은 설문조사를 작성하기 위해 가장 쉽게 접근할 수 있는 모든 사람으로 구성되어 있습니다.

비확률 표본에서 대상 모집단과 조사 표본 사이의 관계는 측정할 수 없고 잠재적 편향을 알 수 없다.비확률 조사 표본의 숙련된 사용자는 조사를 모집단 측정 도구가 아닌 실험 조건으로 보고 내부적으로 일관된 관계에 대해 결과를 검토하는 경향이 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Non-Probability Sampling - AAPOR". www.aapor.org. Retrieved 2020-05-24.
  2. ^ Weisberg, Herbert F. (2005)토탈 서베이 에러 어프로치, 시카고 대학 출판부:시카고 231페이지
  3. ^ "Archived copy" (PDF). Office of Management and Budget. Retrieved 2009-06-17 – via National Archives.
  4. ^ Lohr. 양조장.스웨덴인
  5. ^ 리처드 발리안트, 앨런 H. 도프만, 리처드 M.Royall(2000), 유한 모집단 샘플링 및 추론: 예측 접근법, 뉴욕, Wiley, 19페이지
  6. ^ Salant, Priscilla, I. Dillman, A. Don.자신의 설문조사를 실시하는 방법.제300.723호 S3. 1994
  7. ^ Kish, L.(1965), Survey Samping, New York: Wiley. 페이지 20
  8. ^ Kish, L.(1965), Survey Sampling, New York: Wiley. 페이지 59
  9. ^ "Why Sampling Works - AAPOR".
  10. ^ Wiley, Survey Methodology, Groves 등: New York.
  11. ^ 마이클 W. 링크, 마이클 P. 바타글리아, 마틴 R.Frankel, Larry Osborn 및 Ali H. Mokdad, 일반 인구 조사를 위한 주소 기반 샘플링(ABS)과 랜덤 디짓 다이얼(RDD)의 비교; 여론 Q, 2008년 봄; 72: 6 ~ 27.
  12. ^ "Glossary - NCES Statistical Standards". nces.ed.gov.
  13. ^ "Survey Sampling Methods". www.statpac.com.
  14. ^ Government of Canada, Statistics Canada; Government of Canada, Statistics Canada (28 January 2009). "Learning resources: Statistics: Power from data! Non-probability sampling". www150.statcan.gc.ca.

추가 정보

Groves et alia의 교과서는 설문지 개발에 대한 최근 문헌(인지심리학에 의해 정보 제공)을 포함한 조사 방법론의 개요를 제공한다.

다른 책들은 조사표본의 통계이론에 초점을 맞추고 있으며, 다음 교과서에서 논의한 바와 같이 기초통계 지식이 필요하다.

Scheaffer et alia의 초등학교 책에는 고등학교 대수학에서 나온 2차 방정식이 사용된다.

  • 샤퍼, 리처드 L., 윌리엄 멘덴할, R.라이먼 오트기초 조사 표본, 제5판Belmont: Duxbury Press, 1996.

Lohr, Sérndal et alia 및 Cochran(고전)에 대해 더 많은 수학 통계가 필요하다.

Deming과 Kish의 역사적으로 중요한 책은 사회과학자들의 통찰력(특히 미국 인구조사와 미시간 대학사회연구소에 관한 것)에 귀중한 것으로 남아 있다.

외부 링크