스프레드시트 데이터를 사용하여 ML 모델 교육

TensorFlow Decision Forests (TF-DF)를 사용하여 테이블 형식 데이터에서 기계 학습 모델을 훈련, 평가 및 배포할 수 있습니다. TF-DF는 적은 양의 코드만 필요하고 몇 초 만에 학습하므로 이 프로세스는 빠릅니다. 그러나 데이터가 스프레드시트에 있는 경우 스프레드시트의 데이터를 사용하여 기계 학습 모델을 교육하고 데이터를 예측하는 가장 간단한 방법은 무엇입니까?

간단한 ML 로고

시트용 단순 ML을 사용하여 대부분의 ML 작업을 Google 스프레드시트에서 직접 수행할 수 있습니다. 단순 ML 사용:

  1. 코드를 작성할 필요가 없습니다.
  2. 교육은 몇 초 안에 브라우저에서 로컬로 실행됩니다.
  3. Simple ML이 생성하는 모델을 TensorFlow, Colab 또는 TF Serving으로 내보낼 수 있습니다.

Simple ML은 TensorFlow Decision Forest와 동일한 코드를 사용하여 모델을 훈련하므로 사용 편의성을 위해 품질을 희생하지 않습니다.

시작하다

한 번 보자

예를 들어 다음 그림은 Palmer Penguins 데이터세트 의 사본이 포함된 스프레드시트를 보여줍니다. 각 행은 펭귄을 나타냅니다. 열의 일부 값이 누락되었습니다. Google Sheets용 Simple ML 애드온을 사용하면 기계 학습을 사용하여 누락된 값을 예측할 수 있습니다.

단순 ML은 누락된 종을 예측합니다. "

내부적으로 Predict Missing Values ​​작업은 지정된 열(이 경우 열)의 값이 포함된 행에서 모델을 훈련한 다음 해당 모델을 사용하여 누락된 값을 예측합니다. 모델을 만들거나 조정할 필요가 없으며 모델에서 입력 기능을 사용하는 방식을 구성할 필요도 없습니다. Simple ML이 모든 작업을 처리합니다.

단순 ML로 무엇을 할 수 있습니까?

Google 시트에서 Simple ML 추가 기능을 활성화한 후 누락된 값을 예측하고 데이터에서 비정상적인 값을 식별할 수 있습니다. Simple ML은 스프레드시트에 새 열을 생성하여 값과 새 값에 대한 신뢰도를 포함합니다.

이러한 작업을 완료하기 위해 Simple ML은 백그라운드에서 ML 모델을 생성하고 스프레드시트의 데이터에 대해 학습시킵니다. 모델은 Google 드라이브 폴더의 simple_ml_for_sheets 라는 폴더에 저장됩니다.

모델을 교육할 데이터 열을 선택하고 선택적으로 교육 알고리즘을 선택하여 모델을 교육할 수도 있습니다.

모델이 학습된 후 이를 사용하여 지정된 열의 모든 값 예측을 비롯한 작업을 수행할 수 있습니다.

모델을 평가하고 이해할 수 있습니다.

모델을 내보내 Colab에서 사용할 수 있습니다.

모델의 세부 정보를 보고 Simple ML이 생성하는 모델의 이름을 바꾸고 삭제할 수 있습니다.

간단한 ML로 데이터를 안전하게 유지

단순 ML은 스프레드시트 데이터를 보존합니다. 단순 ML은 기존 데이터를 덮어쓰지 않고 대신 예측 값과 예측의 신뢰 확률을 보여주는 새 열을 생성합니다. 이렇게 하면 실수로 데이터를 잃지 않습니다.

Simple ML의 교육 작업은 모두 브라우저에서 직접 실행되므로 데이터가 전적으로 Google 시트에 남아 있습니다. 이점은 다음과 같습니다.

  • 개인 정보: 데이터 세트 및 모델은 Google 스프레드시트 이외의 제3자(Google 드라이브 제외)로 전송되지 않습니다.
  • 반응성: 훈련은 즉각적입니다(작은 데이터 세트에서).
  • 할당량 제한 없음: 학습에 머신을 사용하고 있으므로 원하는 만큼 많은 모델을 학습할 수 있습니다.

단순 ML은 스프레드시트의 데이터에 대해 모델을 교육합니다.

단순 ML을 사용하면 세부 사항에 대해 걱정할 필요 없이 스프레드시트에서 ML의 기능을 사용할 수 있습니다. 큰 그림에 대해서만 걱정하면 됩니다. 그 예측으로 무엇을 할 건가요?

그러나 ML 모델 개발 및 사용에 대해 더 많이 알고 있는 개발자의 경우 Simple ML을 통해 모델에 액세스할 수 있습니다. 예를 들어 모델을 수동으로 훈련, 평가, 적용 또는 분석할 수 있으며 새 모델을 만들 때 훈련 알고리즘을 선택할 수 있습니다.

Simple ML을 사용하여 누락된 값 예측과 같은 작업을 수행하면 ML 모델이 생성되어 Google 드라이브의 simple_ml_for_sheets 폴더에 저장됩니다. 그런 다음 해당 모델을 사용하여 예측을 수행하고 다른 데이터를 분석할 수 있습니다. 예를 들어 저장된 모델을 colab에 업로드하여 이를 사용하는 코드를 작성하고 실행할 수 있습니다.

시트용 단순 ML 사용에 대해 자세히 알아보기

시작하려면 ML for Sheets 소개 튜토리얼을 참조하세요.

Simple ML을 사용하는 방법에 대해 자세히 알아보려면 Simple ML for Sheets 설명서를 참조하세요.