요약
이 코드 패턴에서 당뇨병 데이터 세트를 사용하여 사람이 당뇨병에 걸리기 쉬운 지 여부를 예측하는 방법을 알아 봅니다. 코드 패턴은 예측 모델의 공정성, 설명 가능성 및 견고성을 탐색하고 AI 예측 시스템의 효율성을 향상시킵니다. 코드 패턴은 종단 간 솔루션을 보여주고 다음 방법을 보여줍니다.
- AI 360 공정성 툴킷을 사용하여 당뇨병 데이터 세트의 공정성을 확인하십시오.
- 모델 개발
- AI 360 Explainability Toolkit을 사용하여 모델 설명
코드 패턴은 이전 단계의 전체 종단 간 프로세스에 대한 일반 코드 템플릿을 공유합니다. 따라서 공정성과 설명 가능성을 탐색하려는 데이터 세트를 연결하는 데 사용할 수 있습니다.
상품 설명
공정성은 데이터에 의해 도입 된 편향을 이해하고 모델이 모든 인구 통계 그룹에서 공평한 예측을 제공하는지 확인하는 프로세스입니다. 설명 가능성은 기계 학습 모델이 어떻게 예측하는지 보여줍니다. 모델의 작동 방식을 명확히하여 모델에 대한 이해를 향상시킵니다.
이 코드 패턴에서는 당뇨병 데이터 세트를 사용하여 사람이 당뇨병에 걸리기 쉬운 지 여부를 예측합니다. IBM Watson® Studio, IBM Cloud Object Storage, AI Explainability 360 Toolkit 및 AI Fairness 360 Toolkit을 사용하여 데이터를 작성하고 편향 완화 알고리즘을 적용한 다음 결과를 분석합니다.
이 코드 패턴을 완료하면 다음 방법을 이해하게됩니다.
- Watson Studio를 사용하여 프로젝트 만들기
- AI Explainability 360 툴킷 사용
- AI Fairness 360 툴킷 사용
흐름
- Spark에서 제공하는 IBM Watson Studio에 로그인하고 IBM Cloud Object Storage를 시작하고 프로젝트를 작성하십시오.
- .csv 데이터 파일을 IBM Cloud Object Storage에 업로드하십시오.
- Watson Studio 노트북에서 데이터 파일을로드하십시오.
- Watson Studio 노트북에 AI Explainability 360 Toolkit 및 AI Fairness 360 Toolkit을 설치하십시오.
- 전처리, 처리 중, 후 처리 단계에서 편향 완화 알고리즘을 적용한 후 결과를 분석합니다.
명령
이 패턴에 대한 자세한 단계는 추가 정보 파일. 단계는 다음을 수행하는 방법을 보여줍니다.
- IBM Cloud로 계정을 작성하십시오.
- 새 Watson Studio 프로젝트를 작성하십시오.
- 데이터를 추가하십시오.
- 노트북을 만듭니다.
- 데이터를 DataFrame으로 삽입합니다.
- 노트북을 실행하십시오.
- 결과를 분석하십시오.
이 코드 패턴은 AI 360 툴킷 : AI 모델 설명 이해 관계자와 개발자가 AI 모델 수명주기를 완전히 이해하고 정보에 입각 한 결정을 내리는 데 도움이되는 사용 사례 시리즈입니다.
출처 : https://developer.ibm.com/patterns/predict-an-event-with-fairness-explainability-robustness/