휘적이는 기록공간

[Google Cloud Skills Boost] Gemini for Google Cloud Learning Path(Google Cloud를 위한 Gemini 학습 과정) 본문

AI & Data Engineering

[Google Cloud Skills Boost] Gemini for Google Cloud Learning Path(Google Cloud를 위한 Gemini 학습 과정)

휘희 2025. 8. 19. 19:45

 

Gemini for Google Cloud Learning Path

 

해당 과정에서는 개발자, 데이터 분석가, 클라우드 엔지니어, 아키텍트, 네트워크 및 보안 엔지니어 등 다양한 역할의 엔지니어들이 일상의 업무 효율성을 높이기 위해 Gemini를 활용하는 방법에 대해 배울 수 있다.

 

구성: 8개의 모듈

학습 범위: 6개 모듈

 

총 8개의 모듈로 구성되어 있으며, 그중 6개의 모듈을 일주일 동안 학습했다.

 


새롭게 배운 개념

 

BigQuery

  • Google Cloud Platform(GCP)에서 제공하는 완전 관리형 서버리스(Serverless) 데이터 웨어하우스

데이터 웨어하우스

데이터를 통합하여 분석과 의사결정에 활용할 수 있도록 설계된 대규모 데이터 저장소.

단순 저장소가 아닌 분석 친화적인 구조로 데이터를 정리*통합*가공하여 관리하는 시스템

 

 k-평균 클러스터링 모델(K-means Clustering)

  • 데이터 클러스터링에 사용되는 비지도 학습(Unsupervised Learning) 알고리즘 기법 중 하나

데이터를 k개의 그룹(Cluster) 으로 나누는 알고리즘이다. 데이터의 특성에 따라 유사한 데이터를 묶어 분류한다.

그룹의 중심을 평균값(centroid) 으로 정의해서, 각 데이터 포인트를 가장 가까운 중심에 할당함

예: 고객 데이터를 "소비 습관" 기준으로 3그룹으로 나누고 싶을 때 → k=3

 

 

비지도 학습

비지도 학습(Unsupervised Learning)은 라벨이 없는 데이터를 이용해서 데이터 속에 숨어 있는 구조, 패턴, 군집, 특징 등을 자동으로 발견하는 기계학습 방법. 즉, “정답(라벨)”이 주어지지 않은 상태에서 데이터를 탐색하는 방식.

 

-> 비지도 학습은 학습 알고리즘에 결과물이라고 할 수 있는 출력을 미리 제공하지 않고 인공지능(AI)이 입력 세트에서 패턴과 상관관계를 찾아내야 하는 머신러닝 알고리즘

 

데이터 자체가 부족하거나 훈련 데이터를 수집하기에는 비용이 너무 높은 등의 이유로 출력에 대해 알 수 없거나 활용할 수 없을 때 주로 사용

 


후기

 

 

 

클라우드를 Gemini를 활용해서 빠르게 설정 및 관리하는 걸 실습해 볼 수 있다.

 

 

 

 

 

단 Google Cloud Console에 대한 사용 미숙이 좀 힘들었다.

 

SQL쿼리문 작성을 내가하는 것이 아닌 Gemini에게 명령해서 만들었는데,

예제문이랑 조금 씩 다르게 나와서... 같은 스크립트인데 의아했다.

 

 # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending.
 SELECT
     DATE(order_items.created_at) AS order_date,
     order_items.product_id,
     products.name AS product_name,
     ROUND(SUM(order_items.sale_price), 2) AS total_sales
 FROM
     `bigquery-public-data.thelook_ecommerce.order_items` AS order_items
 LEFT JOIN
     `bigquery-public-data.thelook_ecommerce.products` AS products
 ON
     order_items.product_id = products.id
 GROUP BY
     order_date,
     order_items.product_id,
     product_name
 ORDER BY
     total_sales DESC;

해당 쿼리가 내가 원하는 결과물.

 

-- # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending.
SELECT
  CAST(t1.created_at AS DATE) AS order_date,
  t1.product_id,
  t2.product_name,
  ROUND(SUM(t1.sale_price), 2) AS total_sales
FROM
  `example_bigquery_project_id`.`example_bigquery_database`.`order_items` AS t1
INNER JOIN
  `example_bigquery_project_id`.`example_bigquery_database`.`products` AS t2
ON
  t1.product_id = t2.product_id
GROUP BY
  order_date,
  t1.product_id,
  t2.product_name
ORDER BY
  total_sales DESC;

나온 결과문은 이와 같다.

 

 

 

값이 조금씩 안맞는 것들이 있었다.

 

실습 파트가 끝나면 뒤에 영상에서 해당 실습에 대한 것을 영상으로 복습할 수 있는데,

이때 영상을 보고 Console창에 있는 Gemini마다 대답이 다르다는 것을 알 수 있었다.

 

나는 우측 패널에 활성화되는 Gemini를 활용하여 질문을 했는데,

코드를 입력하는 곳이나 sql을 입력하는 곳의 Gemini를 활용해야 한다.

 

만약 우측 패널로 한다면 얼추 값은 맞지만, 의도한 대로 잘 안 나올 가능성이 크다.

뒤늦게 찾은 다른 Gemini

 

우측 패널의 경우 현재 보고 있는 페이지 기준으로 답변을 하지는 못하는 것 같다.

 

K-평균 클러스터링

 

그리고 모듈 3(gcloud CLI를 사용하여 GKE Autopilot 클러스터 생성하기)의 실습의 경우 세 번의 시도 끝에 통과를 할 수 있었다.

 

해당 회차에서는 새롭게 배운 개념들도 있지만,

Google Cloud Console 환경에 익숙해질 수 있도록 배워가기 위해 구성된 것 같다.

 

그래도 평소에 직접 다뤄볼 일 없는 분야(데이터 웨어하우스 등)까지 실습할 수 있는 점이 매력적이라고 생각한다.