본문 바로가기

카테고리 없음

2026

반응형

다음은 제공해주신 내용을 Markdown 파일 형식으로 변환한 것입니다. 원본 자료의 구조와 내용을 최대한 보존하면서, 가독성을 높이기 위해 중요한 부분에 볼드체를 적용했습니다.

# AI
### [KICE 2025년 Pilot]
[2025년 Pilot차수]
문항1) 다음 중 딥러닝 모델 개발을 위한 데이터 수집 과정에서 데이터 편향 (Data bias)을 줄이는
방법으로 가장 적절하지 않은 것을 고르시오. [3점]
① 다양한 인구 집단으로부터 데이터를 수집하여 사회적 다양성을 보장한다.
② 소수 그룹의 데이터를 추가로 수집하거나 재샘플링하여 데이터 클래스 불균형을 해소한다.
③ 데이터 레이블링 시 전문가 대표 한 명이 수행하여 데이터 일관성과 객관성을 확보한다.
④ 도메인 전문가의 의견을 수렴하여 데이터의 대표성을 검토하고 불필요한 특성을 제거한다.
⑤ 수집한 데이터에 대한 통계적 분석을 실시하여 편향의 가능성을 감지하고 조정한다.

(정답)**③**
(해설)**데이터 레이블링 과정에서 대표 한 명이 모든 레이블링 작업을 진행하는 방식은 일관성을 유지할 수는 있지만, 한 개인의 판단에 대한 편향이 데이터 전체에 반영될 위험이 크다.** 이는 모델 개발 시 데이터의 정확성과 객관성을 저해할 수 있으며, 결과적으로 데이터셋 전체의 편향을 증가시킬 수 있다. 데이터 레이블링은 가능한 한 **다양한 관점을 반영하도록 여러 사람이 참여하거나, 검증 절차를 통해 각 레이블의 신뢰성을 높이는 것이 중요하다.**
(배점)3
(난이도)하
- 문제유형: 선다형
- 출제영역: AI 데이터 전처리>데이터 수집
- 문제 제목: 데이터 편향 해결
- 출제 의도: 데이터 수집 시 데이터 편향을 줄이는 방법에 대한 이해를 확인한다.

[2025년 Pilot차수]
문항 2) (가)와 (나)는 데이터 전처리 과정에서 사용되는 서로 다른 데이터 정제 방법이다. <보기>에서 각
방법에 대한 내용을 올바르게 설명한 것을 고르시오. (𝑥𝑚𝑖𝑛: 𝑥에서의 최소값, 𝑥𝑚𝑎𝑥 : 𝑥 에서의 최대값, 𝜇 :
𝑥의 평균, 𝜎: 𝑥 의 표준편차) [3점]
(가) : $x_{new} = \frac{x-x_{min}}{x_{max}-x_{min}}$, (나): $x_{new} = \frac{x-\mu}{\sigma}$,
<보기>
ㄱ. 데이터의 범위를 일정한 구간으로 변환하는 과정으로 일반적으로 0 과 1 사이의 범위로
데이터를 스케일링한다.
ㄴ. 데이터가 정규 분포를 따를 때 효과적이며 회귀 분석이나 PCA 와 같은 알고리즘에서 특히
많이 사용한다.
ㄷ. 데이터에 존재하는 이상치(Outlier)에 비교적 많은 영향을 받는다.
ㄹ. 데이터의 스케일(scale)을 조정하여 모델 학습을 효율적으로 진행할 수 있도록 도와준다.
(가) (나)
① ㄱ, ㄴ ㄷ, ㄹ
② ㄱ, ㄹ ㄴ, ㄷ, ㄹ
③ ㄱ, ㄷ, ㄹ ㄴ, ㄹ
④ ㄴ, ㄷ ㄱ, ㄹ
⑤ ㄴ, ㄷ, ㄹ ㄱ, ㄹ

(정답)**③**
(문제풀이)(가)는 정규화 기법인 **Min-max normalization**을, (나)는 **표준화(standardization)**를 나타낸다.
*   ㄱ. **정규화**는 데이터의 범위를 일정 구간으로 변환하는 과정으로 0과 1 사이의 범위로 데이터를 스케일링한다.
*   ㄴ. **표준화**는 데이터가 정규 분포를 따를 때 효과적이다. 회귀 분석이나 PCA 와 같은 알고리즘에서 특히 많이 사용된다.
*   ㄷ. **최소-최대 정규화**를 사용할 때, 이상치가 포함된 데이터의 경우 최소값과 최대값이 크게 변할 수 있다.
*   ㄹ. 정규화와 표준화 모두에 해당되는 설명으로써, 두 방법 모두 모델 학습을 효율적으로 진행할 수 있도록 도와준다.
(배점)3
(난이도)하
- 문제유형: 선다형
- 출제영역: AI 데이터 전처리>데이터 정제
- 문제 제목: 정규화 및 표준화
- 출제 의도: 데이터 정제 방법인 정규화와 표준화의 개념과 차이에 대한 이해 확인한다.

[2025년 Pilot차수]
문항3) 다음은 Sequence to Sequence 모델에서 입력 문장에 대한 텍스트 데이터 정제 과정을 나타낸
것이다. 이때 문장 기호는 전처리 과정에서 삭제하는 것으로 결정하였다. 이 정제 과정을 거친 문장은
모델의 배치 학습에 사용된다. 이때 (가), (나), (다), (라)에 들어갈 토큰을 <보기>에서 고르시오. [3점]
<보기>
<SEP>: Separator / <EOS>: End of Sequence / <MASK>: Mask / <UNK>: Unknown /
<SOS>: Start of Sequence / <CLS>: Classification / < PAD>: Padding
(가)_____(나) _____ (다) _____ (라) _____

(정답)**(가) <SOS> (나) <EOS> (다) <PAD> (라) <UNK>**
(해설)**<SOS> (Start of Sentence)**는 문장의 시작을, **<EOS> (End of Sentence)**는 문장의 종료를 나타낸다.
**<PAD> (Padding Token)**는 문장의 길이를 일정하게 맞추기 위해 사용되는 토큰이다. **<UNK> (Unknown Token)**은 사전에 없는 단어를 처리하기 위한 토큰이다.
따라서, (가)는 문장의 시작을 나타내야 하므로 **<SOS>**, (나)는 문장의 끝을 나타내야 하므로 **<EOS>**이다.
“She loves me.”라는 문장은 다른 문장에 비해 단어 하나가 부족하므로 문장의 길이를 일정하게 맞춰주기 위해 **<PAD>** 토큰을 추가해야 한다. <PAD> 토큰은 <EOS> 뒤에 와야 하므로 (다)는 **<PAD>**이다. (라)의 경우에는 “accordion”이란 단어가 단어 사전에 없으므로 미등록 단어인 “accordion”을 **<UNK>** 토큰으로 대체해야 하므로 (라)는 **<UNK>**이다.
(배점)3
(난이도)하
- 문제유형: 단답형
- 출제영역: AI 데이터 전처리>데이터 정제
- 문제 제목: 텍스트 데이터 정제
- 출제 의도: 텍스트 데이터 정제 과정 중 스페셜 토큰에 대한 이해를 확인한다.

[2025년 Pilot차수]
문항4) 다음 보기에 있는 데이터를 정제하려고 한다. 정제하기 전과 정제하고 난 후의 데이터와 주어진
지시사항을 보고 다음 (A)와 (B)에 들어갈 코드를 순서대로 작성하시오. [4점]
```python
import pandas as pd
import numpy as np

data = {
'TransactionID':,
'ProductID': ['P100', 'P100', 'P100', 'P100', 'P300', np.nan, 'P200', 'P300', 'P300', 'P300'],
'Quantity':,
'TransactionDate': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05',
'2023-01-06', '2023-01-07', '2023-01-08', '2023-01-09', '2023-01-10'],
'CustomerID': ['C003', 'C004', 'C002', 'C003', 'C004', 'C001', 'C002', 'C001', 'C002', 'C003'],
'Price': [2003.0, 4211.7, 4761.0, 2639.0, 1856.0, 2403.0, 1123.0, 3279.0, 2001.0, 3894.0]
}
df = pd.DataFrame(data)

#NaN 제거
df.(A)
# 반올림 및 int형으로 변환
df[‘Price’] = (B)

<데이터 정제 전> (데이터프레임 이미지) <데이터 정제 후> (데이터프레임 이미지)

(정답)(A)dropna(inplace=True) (B) df[‘Price’].round().astype(int) (해설)(A)는 dropna(inplace=True) 이다. Pandas의 dropna 함수는 결측치(NaN)을 다루는데 사용되는 함수이다. 또한 dropna 함수는 데이터프레임의 변경 사항을 새로운 객체로 반환하고 원본 데이터프레임은 변경하지 않기 때문에, 결측치 제거한 결과를 위해서는 inplace=True 파라미터를 사용하여 원본 데이터프레임에 직접적인 변경을 적용해야 한다. (B)는 round().astype(int) 이다. 데이터 정제 전에는 두번째 행의 Price값이 4211.7이었는데, round 함수를 사용하여 반올림을 해서 4212가 되었다. 또한 Price 열의 모든 값이 float형태였는데, astype(int)를 사용하여 모두 int 형으로 변환하였다. (배점)4 (난이도)중

  • 문제유형: 단답형
  • 출제영역: AI 데이터 전처리>데이터 정제
  • 문제 제목: 데이터 정제
  • 출제 의도: 기초적인 데이터 정제 방법의 코드 작성에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항5) 성찬이는 자율주행 차량 회사에서 근무하고 있으며, 자율주행에 필요한 AI 모델을 개발하고 있다. 성찬이의 주요 업무는 주변 환경을 의미론적 분할(Semantic Segmentation)하는 기능을 자동으로 수행하는 모델을 개선하는 것이며, 모델의 성능을 높이기 위해 데이터 증강(Data Augmentation) 기법을 사용하려고 한다. 다음 중 자율주행 차량의 의미론적 분할 기능 향상에 가장 적합한 데이터 증강 방법을 고르시오. [3점] ① Gaussian Blur ② ADASYN (Adaptive Synthetic Sampling Approach) ③ Random Erasing ④ Mixup ⑤ SMOTE (Synthetic Minority Over-sampling Technique)

(정답) (해설)Random Erasing은 이미지의 일정 부분을 무작위로 삭제하거나 가리는 기법이다. 자율주행 차량의 의미론적 분할에서는 모델이 실제 도로 환경에서 발생할 수 있는 가려짐이나 누락된 시야를 처리할 수 있어야 한다. Random Erasing은 모델이 이러한 불완전한 정보에서도 중요한 특징을 인식하고 학습할 수 있게 하여, 실제 세계의 불확실한 조건에 더 강인한 모델을 만들 수 있도록 돕기 때문에 적합한 데이터 증강 방법이다. Gaussian Blur는 이미지를 부드럽게 만드는 효과를 주어 세부 사항을 감소시킨다. 의미론적 분할에서 객체의 정확한 경계가 중요하다. 따라서, Gaussian Blur를 사용하면 경계가 흐려질 수 있어 정확한 픽셀 레벨 분할에 방해가 될 수 있기 때문에 적합하지 않은 데이터 증강 방법이다. ADASYN, SMOTE는 불균형한 데이터셋에서 소수 클래스의 샘플을 합성하여 더 많이 생성하는 기법이다. 주로 분류 문제에서 사용되는 데이터 증강 방법이며, 의미론적 분할에서는 이미지 데이터의 픽셀 단위 변형을 주는 것이 더 중요하기 때문에 적합하지 않은 데이터 증강 방법이다. Mixup은 두 이미지를 선형적으로 혼합하는 기법으로, 이는 이미지 분류 문제에서 유용할 수 있지만 의미론적 분할에서는 각 픽셀의 정확한 레이블이 필수적이다. 따라서, 두 이미지를 혼합하는 것은 경계를 더욱 모호하게 만들 수 있으므로 적합하지 않은 데이터 증강 방법이다. (배점)3 (난이도)중

  • 문제유형: 선다형
  • 출제영역: AI데이터 전처리>데이터 증강
  • 문제 제목: 데이터 증강 기법 이해
  • 출제 의도: 데이터 증강 기법 방법들에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항6) 다음은 그래프 데이터 증강 기법에 관한 설명이다. 그래프는 아래 그림과 같이 노드(Node)와 엣지(Edge)로 구성이 되어 있으며, 각 노드는 그에 관한 특징(Node Feature)을 가지고 있다. 그래프의 구조적 특징을 고려하여 그래프 데이터 증강 기법을 적용했을 때 얻을 수 있는 기대 효과로 옳은 설명을 고르시오. [3점] (그래프 그림 이미지) ① Node Dropout: 이 방법은 네트워크의 중심 노드가 더욱 강조되어, 특정 노드에 대한 의존도를 증가시키는 데 도움을 준다. ② Edge Dropout: 이 방법은 그래프 데이터의 전체적인 연결성을 강화시켜, 그래프 데이터에 대한 모델의 강인성(Robustness)를 증가시킨다. ③ Node Feature Masking: 이 방법은 모델이 노드의 부분적인 정보만을 가지고 판단을 내릴 수 있도록 돕기 때문에 특성에 대한 의존도를 감소시켜 모델의 강인성을 증가시킨다. ④ Edge Rewiring: 이 방법은 기존 엣지를 재구성함으로써 그래프가 더 많은 정보를 처리할 수 있도록 한다. ⑤ Subgraph Sampling: 이 방법은 선택된 부분 그래프(Subgraph)가 전체 그래프의 특성을 보다 정확하게 반영하도록 만든다.

(정답) (해설)Node Dropout은 네트워크에서 임의의 노드(및 연결된 엣지)를 제거함으로써 모델이 노드의 부재에도 불구하고 그래프의 정보를 잘 추론하도록 한다. 이는 모델이 노드의 부재나 불완전한 정보에서도 강인하게 작동할 수 있도록 만드는 것이 목적이며, 중앙성을 강화하거나 특정 노드 의존도를 증가시키는 것이 아니다. Edge Dropout은 이는 모델이 덜 완벽한 연결 정보로부터 중요한 구조적 패턴을 학습하도록 돕는 방법으로, 연결 강도를 향상시키기보다는 모델이 불완전한 데이터에 대해 더 잘 일반화하도록 한다. Edge Rewiring은 그래프의 구조적 다양성을 높이거나 그래프를 최적화하는데 사용할 수 있지만, 이것이 직접적으로 그래프의 정보 처리 능력을 증가시킨다고 말하기 어렵다. Subgraph Sampling은 큰 그래프에서 작은 부분을 추출하여 모델 훈련에 사용한다. 이는 대규모 그래프를 더 효율적으로 처리할 수 있도록 하며, 각 서브그래프가 전체 그래프의 특성을 완전히 대표하지는 않는다. 오히려, 다양한 서브그래프를 통해 모델의 일반화 능력을 향상시키는 것이 주 목적이다. (배점)3 (난이도)하

  • 문제유형: 선다형
  • 출제영역: AI데이터 전처리>데이터 증강
  • 문제 제목: 그래프 데이터 증강 기법
  • 출제 의도: 그래프 데이터의 특성을 고려한 다양한 그래프 데이터 증강 기법을 이해한다.

[2025년 Pilot차수] 문항7) 다음은 데이터 증강을 위해 활용되는 딥러닝 모델에 대한 설명이다. 다음 중 (A), (B), (C)에 대해 올바르게 작성한 것을 고르시오. [3점] **(A)**는 최근 큰 주목을 받고 있는 생성 모델 중 하나로, 복잡한 데이터 분포를 모델링하고 새로운 데이터 샘플을 생성하는 데 사용된다. 이 모델은 물리학에서 영감을 받은 과정을 통해 데이터를 생성하며, 특히 이미지, 음성, 텍스트 생성 등 다양한 분야에서 뛰어난 성능을 보여주고 있다. **(A)**의 학습 과정은 **(B)**과 **(C)**로 이루어져 있다. **(B)**에서는 원본 데이터를 점차적으로 노이즈로 변형시키는 과정이다. 이 과정은 명확한 데이터에서 시작하여 각 단계마다 조금씩 더 많은 노이즈를 추가하여, 최종적으로 완전히 노이즈로 전환된다. **(C)**는 **(B)**를 역으로 진행하는 것으로, 완전한 노이즈 상태에서 시작하여 원래 데이터로 돌리는 과정이다. 이 과정은 학습된 모델을 사용하여 노이즈를 점차 제거하고 데이터를 복원한다. ① (A) : Generative Adversarial Networks (B) : Generate (C) : Discriminate ② (A) : Generative Adversarial Networks (B) : Forward Process (C) : Backward Process ③ (A) : Generative Adversarial Networks (B) : Perturbation (C) : Reconstruction ④ (A) : Diffusion Model (B) : Forward Process (C) : Backward Process ⑤ (A) : Diffusion Model (B) : Backward Process (C) : : Forward Process

(정답) (해설)**확산 모델(Diffusion model)**은 데이터를 생성하는 생성 모델 중 하나로 데이터로부터 노이즈(Noise)를 조금씩 더해가면서 데이터를 완전히 노이즈로 만드는 **전파 과정(Forward Process)**과 이와 반대로 노이즈로부터 조금씩 복원해가면서 데이터를 만들어내는 **역전파 과정(Backward Process)**을 활용한다. 따라서 ④번이 옳은 답변이다. (배점)3 (난이도)하

  • 문제유형: 선다형
  • 출제영역: AI데이터 전처리>데이터 증강
  • 문제 제목: 확산 모델
  • 출제 의도: 데이터 증강에 활용될 수 있는 확산 모델에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항8) 다음 <보기> 중 Self-supervised Learning 기법에 대한 설명으로 옳은 것을 모두 고른 것은? [4점] <보기> ㄱ. SimCLR에서 Contrastive loss 계산 시 분자는 Positive sample 간의 유사도를 나타낸다. ㄴ. BYOL의 타켓 네트워크는 경사하강법을 통해 업데이트 되고, 온라인 네트워크는 타켓 네트워크의 파라미터를 이용한 EMA(Exponential Moving Average)를 방식으로 업데이트 된다. ㄷ. Jigsaw puzzle은 입력 이미지를 여러 패치로 분할하고, 이를 특정 기준에 따라 섞은 후 원래 순서대로 재배열함으로써 특징을 학습한다. ㄹ. MAE(Masked Auto Encoder)의 Encoder는 마스킹된 패치에 대한 정보를 추론할 수 있도록 학습되어, Decoder는 마스킹된 패치들 사이의 정보를 보간한다. ㅁ. RotNet은 이미지를 여러 각도로 회전시킨 후 해당 각도를 예측하는 방식으로 이미지의 특징을 학습한다. ① ㄱ, ㄴ ② ㄴ, ㄷ ③ ㄹ, ㅁ ④ ㄱ, ㄹ, ㅁ ⑤ ㄷ, ㄹ, ㅁ

(정답) (해설)

  • ㄱ. SimCLR의 학습 과정에서 Contrastive loss 계산 시 분자는 Positive sample 간의 유사도를 나타내며, 분모는 같은 배치의 다른 모든 샘플에 대한 유사도를 나타낸다. (옳은 설명)
  • ㄴ. BYOL온라인 네트워크가 경사하강법을 통해 업데이트되고, 타켓 네트워크는 온라인 네트워크의 파라미터를 이용한 EMA 방식으로 업데이트된다. (틀린 설명)
  • ㄷ. Jigsaw puzzle 기법에서 패치들은 무작위로 섞이고, 원래 순서대로 재배열함으로써 특징을 학습한다. (틀린 설명)
  • **ㄹ. MAE(Masked Auto Encoder)**의 Encoder는 마스킹된 이미지를 latent representation으로 만든다. 이 과정에서, Encoder는 누락된 정보를 추론하는 법을 학습하게 된다. Decoder는 Encoder로부터 받은 latent representation을 사용하여 원본 이미지의 마스킹된 부분을 복원한다. 이 복원 과정에서 Decoder는 마스킹된 부분을 보간하고, 원본 데이터와 비교하여 학습하는데, 이를 통해 원본 이미지를 가능한 정확하게 복원하려고 시도한다. (옳은 설명)
  • ㅁ. RotNet은 주어진 이미지를 여러 각도로 회전시킨 후 이미지가 어느 각도로 회전했는지를 예측하며 이미지의 특징을 학습하는 self-supervised 학습 기술이다. (옳은 설명) (배점)4 (난이도)상
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발>AI모델 아키텍처 설계
  • 문제 제목: Self-supervised Learning
  • 출제 의도: Self-supervised Learning 의 다양한 기법에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항 9) 다음 <보기>중 자연어처리 모델 관련 설명으로 옳은 것을 모두 고른 것은? [4점] <보기> ㄱ. GPT는 두 문장이 서로 연속된 관계에 있는지 여부를 예측하는 작업을 통해 사전 학습(pre- training)을 수행한다. ㄴ. SpanBERT는 문장의 일부를 가린 후 하나의 span으로부터 얼마나 많은 토큰이 누락되었는지를 예측하여 사전 학습을 수행한다. ㄷ. RoBERTa는 학습 데이터의 일부 단어를 특정 기준을 통해 선택적으로 마스킹하여 모델이 마스킹 된 토큰을 예측하여 사전 학습을 수행한다. ㄹ. ELECTRA는 Generator와 Discriminator로 이루어진 모델로, 생성자가 진짜 문장을 생성하고 구분자는 진짜 문장과 가짜 문장을 구별하도록 학습된다. ① 없음 ② ㄹ ③ ㄴ, ㄷ ④ ㄷ, ㄹ ⑤ ㄴ, ㄷ, ㄹ

(정답) (해설)

  • ㄱ. GPT는 Transformer Decoder 구조를 사용하는 언어 모델로, 다음에 올 단어를 예측하는 방식으로 사전 학습을 수행한다. 즉, 보기에서 설명한 두 문장이 서로 연속된 관계에 있는지 여부를 예측하는 작업은 **Next Sentence Prediction(NSP)**으로, BERT에서 사용하는 방법이므로 오류이다.
  • ㄴ. SpanBERT는 긴 텍스트 조각(span)을 마스킹하고 그 span을 구성하는 전체 토큰을 예측하는 방식으로 학습한다. 누락된 토큰의 수를 예측하는 것이 아니라, 마스킹된 토큰 자체를 예측한다. 보기의 설명은 BART에 대한 설명이므로 오류이다.
  • ㄷ. RoBERTa는 BERT의 마스킹 과정을 개선한 것으로, **동적 마스킹(Dynamic masking)**을 사용한다. 이는 데이터를 로딩할 때마다 마스킹 위치를 바꾸는 것을 의미하며, 특정 기준으로 ‘선택적으로’ 마스킹하지 않으므로 오류이다.
  • ㄹ. ELECTRA의 Generator는 마스킹된 위치에 대한 토큰을 예측하고, Discriminator는 이 토큰이 실제 데이터에서 오는 것인지 아니면 Generator에 의해 생성된 것인지를 판별한다. 전체 ‘문장’이 아니라 개별 ‘토큰’ 수준에서 이 작업이 이루어지므로 오류이다. (배점)4 (난이도)상
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발>AI모델 아키텍처 설계
  • 문제 제목: 자연어 처리 모델 이해
  • 출제 의도: 핵심 자연어 처리 모델들에 대한 전반적인 이해를 확인한다.

[2025년 Pilot차수] 문항 10) 다음 <보기>에서 설명하는 (A) 기술에 해당하는 기법을 영어로 쓰시오. [4점] <보기> **(A)**는 큰 언어 모델을 효율적으로 Fine-tuning 하기 위한 기술로, 모든 Parameter를 조정하는 대신 소수의 새로운 Parameter 만을 추가하고 조정하는 방식이다. **(A)**는 대규모 언어 모델의 가중치 행렬을 업데이트 할 때 전체 가중치 행렬을 직접 수정하는 대신 두 개의 저차원 행렬을 도입하여, 이들의 곱으로 가중치 행렬의 변화를 모델링한다. 이러한 **(A)**의 방식은 필요한 훈련 Parameter의 수를 크게 줄이면서, 새로운 작업에 대해 모델을 효과적으로 Fine-tuning 할 수 있다.

(정답)Low-Rank Adaptation (해설)**LoRA(Low-Rank Adaptation)**는 대규모 언어 모델의 파라미터 효율성을 향상시키기 위해, 전체 가중치 행렬을 직접 수정하는 대신, 두 개의 저차원 행렬 𝐴와 𝐵를 사용한다. 이 행렬들은 사전 훈련된 모델의 각 Transformer layer에 삽입되어, 𝐴와 𝐵의 곱 𝐵𝐴가 원래의 가중치 𝑊0에 더해져서, 가중치의 변화 ∆𝑊를 모델링한다. 이 저차원 곱셉은 본질적으로 모델의 표현력을 증가시키면서도 파라미터 수는 상대적으로 적게 증가시켜, 전체 모델의 파라미터를 크게 늘리지 않고도 특정 작업에 더 효과적으로 적응할 수 있도록 돕는다. (배점)4 (난이도)중

  • 문제유형: 단답형
  • 출제영역: AI 모델 개발>AI모델 아키텍처 설계
  • 문제 제목: Low-Rank Adaptation
  • 출제 의도: 대용량 언어 모델의 튜닝 방법인 Low-Rank Adaptation에 대한 이해를 확인한다. Ref) Hu, E. J., Shen, Y., Wallis, P., Allen-Zhu, Z., Li, Y., Wang, S., ... & Chen, W. (2021). Lora: Low-rank adaptation of large language models. arXiv preprint arXiv:2106.09685.

[2025년 Pilot차수] 문항11) 아래 그림은 개/고양이 분류를 위한 설명 가능한 딥러닝 모델 중 하나에 대한 추론 과정 예시이다. 다음 <보기> 중 해당 모델에 대한 설명으로 옳은 것을 모두 고른 것은? [4점] (개/고양이 분류 모델 추론 과정 예시 이미지) <보기> ㄱ. 딥러닝 모델이 분류 과정에서 입력 영상의 어느 부분이 가장 중요했는지 이해하기 위한 방법으로 특징맵(feature map)에 대한 손실함수(loss function)에 대한 기울기를 기반으로 특징맵의 중요도를 구하는 방법이다. ㄴ. [가]에 들어갈 값은 1이다. ㄷ. 𝜔1, 𝜔2 , 𝜔3 은 완전연결계층(fully connected layer)의 가중치(weight)이고 분류에 대한 특징맵의 중요도를 나타낸다. 가중치가 높아질수록 특징맵의 중요도가 올라간다. ㄹ. 다양한 계층에서의 특징맵으로 Class activation map을 구할 수 있다. ① ㄱ ② ㄱ, ㄴ ③ ㄴ, ㄷ ④ ㄴ, ㄹ ⑤ ㄱ, ㄴ, ㄷ

(정답) (해설)해당 보기는 Class Activation Map (CAM) 모델이다.

  • ㄱ. CAM은 딥러닝 모델이 분류 과정에서 입력 영상의 어느 부분이 가장 중요했는지 이해하기 위한 방법은 맞으나 특징맵에 대한 손실함수에 대한 기울기가 아니라 완전연결계층의 가중치로 특징맵의 중요도를 구한다. 손실함수에 대한 기울기를 기반으로 중요도를 구하는 것은 Grad-CAM에 대한 내용이다. (틀린 설명)
  • ㄴ. GAPGlobal Average Pooling으로써, 전체 입력특징값에 대한 평균을 계산한다. 이에 따라, [가]에 들어갈 값은 (-3+0+2+2+2+4+2+3-3)/9 = 1이다. (옳은 설명)
  • ㄷ. 𝜔1 , 𝜔2 , 𝜔3완전연결계층의 가중치이고 분류에 대한 특징맵의 중요도를 나타낸다. CAM은 이 중요도를 이용하여 특징맵의 가중치 합으로 분류에 대한 중요 특징맵을 시각화할 수 있다. (옳은 설명)
  • ㄹ. CAMGAP에 대한 제약이 있어 반드시 GAP와 GAP 이전 특징맵을 사용해야 한다. (틀린 설명) (배점)4 (난이도)중
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발> XAI (Explainable AI)
  • 문제 제목: CAM 모델 작동원리 이해
  • 출제 의도: 설명가능한 AI 모델 중 하나인 CAM에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항12) 다음은 설명가능한 AI에 대한 설명이다. 아래 빈칸 (A)-(C)에 들어갈 용어로 가장 알맞은 것을 고르시오. [3점] 딥러닝 모델은 매우 많은 수의 뉴런과 계층을 포함하며, 이들 사이의 복잡한 상호작용으로부터 패턴을 학습한다. 그 결과, 모델의 내부 동작을 이해하기가 어려울 수 있다. [ (A) ] 모델은 내부 작동 과정을 외부에서 쉽게 이해하거나 해석할 수 없는 복잡한 모델을 가리킨다. 이 모델은 입력과 출력 간의 관계를 나타내는데, 내부에서는 어떤 알고리즘이 사용되었는지 각각의 요소들이 어떻게 상호작용하는지에 대한 정보가 불분명하다. 따라서 외부에서는 이 모델이 어떻게 예측을 내리는지 또는 결정을 하는지에 대한 설명이 어려울 수 있다. 이 모델의 내부 동작을 이해하는 방법 중 하나는 해석이 가능한 모델을 사용하는 것이다. 해석이 가능한 모델 중에는 [ (B) ] 모델이 있다. [ (B) ] 모델은 기계 학습에서 이진 분류 문제를 해결하는 데 사용되는 선형 모델이다. 이 모델은 입력 특징들의 가중치 합을 계산하고 확률을 출력한다. 이러한 확률은 주어진 입력이 두개의 클래스 중 어떤 클래스에 속할 확률을 나타내며, 일반적으로 0과 1 사이의 값으로 나타난다. 이런 해석 가능한 모델은 [ (C) ] 모델로 사용될 수 있다. [ (C) ] 모델은 복잡하고 해석이 어려운 [ (A) ] 모델의 예측을 [ (B) ] 모델 같은 해석 가능한 모델에 학습시킨다. 이를 통해 데이터와 복잡한 [ (A) ] 모델의 예측에 대해 해석하고 이해하는 데 도움을 준다. ① (A) : 화이트박스 (white box) (B) : 선형 회귀 (Linear regression) (C) : Grad-CAM ② (A) : 화이트박스 (white box) (B) : 로지스틱 회귀 (Logistic regression) (C) : Surrogate ③ (A) : 블랙박스 (black box) (B) : 선형 회귀 (Linear regression) (C) : Grad-CAM ④ (A) : 블랙박스 (black box) (B) : 선형 회귀 (Linear regression) (C) : Surrogate ⑤ (A) : 블랙박스 (black box) (B) : 로지스틱 회귀 (Logistic regression) (C) : Surrogate

(정답) (해설)

  • (A) 블랙박스 (Black box): 블랙박스는 시스템 또는 모델의 내부 동작 원리가 알려지지 않거나 해석하기 어려운 경우를 의미한다. 즉, 시스템이나 모델이 어떻게 작동하는지 이해하기 어려운 상태를 말한다.
  • (B) 로지스틱 회귀 (Logistic regression): 로지스틱 회귀는 종속 변수가 범주형 데이터인 경우에 사용되는 회귀 분석 기법으로써, 이진 분류 문제에 주로 사용되며, 선형 함수와 로지스틱 함수를 결합하여 범주에 대한 확률을 예측한다.
  • (C) Surrogate: Surrogate 모델은 복잡한 시스템이나 모델을 대신하여 근사치를 제공하는 보조 모델로써, 블랙박스 모델의 예측을 해석하고 이해하는 데 도움을 준다. 일반적으로 블랙박스 모델은 그 자체로는 해석하기 어려운 경우가 많은데, 이 경우 Surrogate 모델을 사용하면 블랙박스 모델의 동작을 보다 쉽게 이해할 수 있다. (배점)3 (난이도)하
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발> XAI (Explainable AI)
  • 문제 제목: 블랙박스 모델의 문제와 설명가능한 AI의 이해
  • 출제 의도: 블랙박스 모델의 문제를 이해하고 이를 위한 설명가능한 AI방법들에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항13) (가)와 (나)는 각각 민지와 영희가 같은 데이터셋에 대한 딥러닝 모델을 학습한 결과이다. 다음 <보기> 중 영희가 더 좋은 결과를 얻기 위해, 취할 수 있는 방법으로 적절한 것을 모두 고른 것은? [3점] (가) (그래프 이미지) (나) (그래프 이미지) <보기> ㄱ. 모델의 레이어 수를 늘려 모델의 복잡성 늘리기 ㄴ. 데이터의 차원을 증가시켜 더 많은 특징(feature) 사용 ㄷ. L2 규제(Regularization) 항의 추가를 통한 모델의 가중치 제한 ㄹ. 더 적은 epoch 설정을 통해 모델 학습의 조기 종료 ① ㄱ, ㄴ ② ㄱ, ㄷ ③ ㄴ, ㄷ ④ ㄴ, ㄹ ⑤ ㄱ, ㄴ ,ㄹ

(정답) (해설)영희의 결과 (나)는 (가)에 비해 **언더피팅(underfitting)**이 발생했다는 것을 보여준다.

  • ㄱ. ㄴ. 언더피팅을 방지하기 위해서는 모델 복잡성을 증가시키고 더 많은 특성을 추가하여 모델이 데이터를 더 잘 학습할 수 있도록 도울 수 있다.
  • ㄷ. L2 규제는 오버피팅을 방지하는 용도로 주로 사용된다.
  • ㄹ. 학습을 일찍 종료시키는 조기 종료 방식 또한 오버피팅에 사용되는 방법으로 언더피팅의 경우 오히려 훈련 기간 즉 에폭 수를 증가시키는 것이 더 도움이 된다. (배점)3 (난이도)하
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발>AI모델 학습 및 평가
  • 문제 제목: 언더피팅
  • 출제 의도: 언더피팅이 발생한 상황을 파악하고 해결하기 위한 방법에 대한 이해 확인한다.

[2025년 Pilot차수] 문항14) 공항에서 보안 검색을 위해 X-ray 스캔을 사용하는 경우, 위험한 물체를 놓치지 않고 식별하는 모델을 구성하였다. 아래 표는 딥러닝 모델의 감지 결과를 나타낸 혼동 행렬(confusion matrix)이다. 위험한 물체를 놓치게 되어 안전에 위협이 생길 수 있는 상황을 최대한 방지하기 위해 모델의 성능 검증 지표로 실제 위험 물체를 얼마나 정확하게 감지했는지를 나타내는 (A)지표를 사용한다고 할 때, (A)에 해당하는 지표가 무엇인지 쓰고 다음 모델의 (A)지표 성능을 계산하여 작성하시오. (Positive: 위험한 물체, Negative: 위험하지 않은 물체) [3점]

예측 결과

Positive (+1)Negative (-1)

실제 정답    
Positive (+1) 990 10
Negative (-1) 500 9500

(정답)(A): 재현율(Recall), 0.99 (해설)위험한 물체를 놓치게 되어 안전에 위협이 생길 수 있는 상황을 최대한 방지하기 위해 모델의 성능 검증 지표로 실제 위험 물체를 얼마나 정확하게 감지했는지를 나타내는 (A)지표는 Recall(재현율)이다. (A) Recall(재현율)은 다음과 같이 계산된다: $Recall = \frac{True Positives}{True Positives + False Negatives}$ 혼동 행렬에서 True Positives 는 990 이고, False Negatives 는 10 이기 때문에, Recall 은 다음과 같이 계산된다: $Recall = \frac{990}{990+10} = 0.99$ (배점)3 (난이도)하

  • 문제유형: 단답형
  • 출제영역: AI 모델 개발>AI 학습 및 평가
  • 문제 제목: AI 모델 평가(재현율)
  • 출제 의도: AI 모델의 평가지표 중 하나인 재현율에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항15) 공장에서 생산한 제품에 대해 불량품을 판단하는 모델을 구성하였을 때, 딥러닝 모델의 불량품 감지 결과가 아래 표와 같은 혼동 행렬(confusion matrix)을 나타냈을 때, 다음 <보기>에서 이 문제의 해결방안으로 옳은 것을 모두 고른 것은? (Positive: 불량 제품, Negative: 정상 제품) [3점]

예측 결과

Positive (+1)Negative (-1)

실제 정답    
Positive (+1) 0 10
Negative (-1) 0 9990

<보기> ㄱ. Positive샘플을 기반으로 새로운 샘플을 생성하여 사용 ㄴ. Positive 샘플 분류 결과에 대해 더 낮은 가중치를 부여 ㄷ. Negative 샘플에 대한 under sampling 수행 ㄹ. 포컬 손실(Focal loss)을 통해 모델이 쉽게 분류할 수 있는 샘플에 대한 손실 감소 ① ㄱ, ㄴ ② ㄱ, ㄹ ③ ㄴ, ㄷ ④ ㄱ, ㄴ, ㄹ ⑤ ㄱ, ㄷ, ㄹ

(정답) (해설)혼동 행렬에서는 **클래스 불균형(class imbalance)**으로 인한 문제가 발생했다는 것을 알 수 있다. 불량 제품을 잘 분류하는 것이 목적인데, 클래스 불균형(class imbalance)으로 인하여 모든 테스트 샘플이 정상 제품(negative)으로 분류가 되는 것을 확인할 수 있다.

  • ㄱ. SMOTE로 대표되는 오버샘플링에 대한 설명으로 클래스 불균형을 해결하기 위한 방법이다. (옳은 해결 방안)
  • ㄴ. weighted cross entropy에 대한 설명으로 소수 클래스(Positive)가 아닌 다수 클래스에 대해 더 낮은 가중치를 부여해야 한다. (틀린 설명)
  • ㄷ. 다수 클래스에 대한 under sampling을 수행을 통해 클래스 불균형 문제를 완화할 수 있다. (옳은 해결 방안)
  • ㄹ. 포컬 손실은 모델이 어려운 샘플에 집중하여 소수 클래스에 더 잘 분류하도록 돕는 손실 함수로 클래스 불균형 문제를 해결한다. (옳은 해결 방안) (배점)3 (난이도)하
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발>AI 모델 튜닝
  • 문제 제목: 클래스 불균형 이해
  • 출제 의도: 클래스 불균형 문제에 대한 기본 개념 및 해결방안에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항16) 다음 <보기> 중 하이퍼파라미터 튜닝(hyperparameter tuning)과 관련된 설명으로 옳은 것을 모두 고른 것은? [3점] <보기> ㄱ. 하이퍼파라미터 튜닝은 모델의 가중치와 편향, 학습률, 배치 크기 등을 조정하여 훈련 데이터의 손실을 줄여주는 과정이다. ㄴ. 베이지안 탐색은 이전 시행 결과를 기반으로 더 나은 조합을 선택하는 자동화된 하이퍼파라미터 최적화 방법이다. ㄷ. 주어진 학습 데이터셋이 크고 하이퍼파라미터 공간이 작을 경우 랜덤 탐색과 비교해 그리드 탐색이 효과적이다. ㄹ. 하이퍼파라미터 튜닝은 모델의 과적합과 언더피팅을 방지하고 더 나은 성능을 얻을 수 있도록 돕는다. ① ㄱ, ㄴ ② ㄱ, ㄷ ③ ㄴ, ㄷ ④ ㄴ, ㄹ ⑤ ㄱ, ㄴ, ㄹ

(정답) (해설)하이퍼파라미터 튜닝은 모델의 학습 과정을 제어하기 위해 사용되는 매개변수를 조정하는 과정으로써, 모델의 학습에 사용되는 하이퍼파라미터들은 학습률, 배치 크기, 은닉층의 수, 은닉층의 노드 수 등이 있다.

  • ㄱ. 모델의 가중치와 편향은 모델 학습을 통해 조정된다. 하이퍼파라미터는 아니다. (틀린 설명)
  • ㄴ. 베이지안 탐색은 이전 시행 결과를 기반으로 더 나은 조합을 선택하는 자동화된 하이퍼파라미터 최적화 방법이다. (옳은 설명)
  • ㄷ. 주어진 학습 데이터셋이 크고 하이퍼파라미터 공간이 작을 경우 효과적인 방법은 랜덤 탐색이다. (틀린 설명)
  • ㄹ. 하이퍼파라미터 튜닝은 모델의 과적합과 언더피팅을 방지하고 더 나은 성능을 얻을 수 있도록 도와준다. 예를 들어, 학습률을 적절히 조정하여 모델이 빠르게 수렴하도록 할 수 있고, 은닉층의 수나 노드 수를 조정하여 모델의 복잡성을 조절할 수 있다. (옳은 설명) (배점)3 (난이도)하
  • 문제유형: 선다형
  • 출제영역: AI 모델 개발>AI모델 튜닝
  • 문제 제목: 하이퍼파라미터 튜닝
  • 출제 의도: 하이퍼파라미터의 개념과 튜닝 방법에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항 17) AI 시스템을 배포하는 방법에는 모델을 패키징하여 배포할 웹서버에 포함시키는 방법인 Model- in-service와 모델과 웹서버를 분리하여 배포하는 방법인 Model-as-service가 있다. 아래 <보기>에서 두 방법에 대한 설명으로 알맞은 것을 모두 고른 것은? [4점] <보기> ㄱ. Model-in-service는 기존 인프라를 재사용할 수 있는 장점이 있다. ㄴ. Model-as-service는 모델이 웹서버 혹은 클라이언트와 직접적으로 소통하여 레이턴시를 효과적으로 줄일 수 있다. ㄷ. Model-as-service는 Model-in-service에 비해서 서버 하드웨어 확장이 쉽다. ㄹ. Model-in-service는 Model-as-service에 비해서 웹서버의 리소스를 많이 사용할 수 있다. ① ㄱ, ㄷ ② ㄴ, ㄷ ③ ㄷ, ㄹ ④ ㄱ, ㄷ, ㄹ ⑤ ㄱ, ㄴ, ㄹ

(정답) (해설)

  • ㄱ. Model-in-service는 패키징된 모델을 웹서버에 포함시키는 방법으로 모델은 서비스의 일부로 실행되며 기존 인프라를 재사용을 할 수 있는 장점이 있다. (옳은 설명)
  • ㄴ. Model-as-service는 모델을 웹서버와 분리하여 배포하는 방식으로 웹서버가 모델과 상호작용하여 레이턴시가 늘어날 수 있다. (틀린 설명)
  • ㄷ. 모델이 분리되어 있는 Model-as-service는 모델이 웹서버에 포함되어 있는 Model-in-service에 비해서 웹서버를 확장하기 쉽다. (옳은 설명)
  • ㄹ. Model-in-service는 웹서버가 모델을 포함하고 있어서 Model-as-service에 비해서 웹서버의 리소스를 더 많이 사용할 수 있다. (옳은 설명) (배점)4 (난이도)중
  • 문제유형: 선다형
  • 출제영역: 시스템구축>AI시스템 설계 및 배포
  • 문제 제목: Model-in-service/Model-as-service 이해
  • 출제 의도: AI시스템 배포하는 Model-in-service/Model-as-service 방법에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항18) 아래 그림은 AI 모델의 개발 및 배포를 위한 프로세스를 나타낸다. 해당 프로세스를 보고 <보기> 중에서 (가)-(다)에 대한 설명으로 가장 적절히 짝지어진 것을 고르시오. [4점] (AI 모델 개발 및 배포 프로세스 이미지) <보기> A. 수집된 데이터를 데이터 정규화, 크기 조정, 잡음 제거, 이상치 처리 등을 통하여 모델의 학습에 적합한 형식으로 변환한다. B. 데이터에 적합한 알고리즘을 선택하여, 모델의 구조를 설계한다. C. 모델을 포함한 모든 필요한 파일이나 라이브러리를 포함하여 쉽게 전달하고 설치할 수 있도록 하는 단계이며, 예로 Docker 컨테이너로 만드는 것이 있다. D. 손실 함수를 정의하고 최적화 알고리즘을 선택한 후에 모델을 반복적으로 훈련 데이터를 학습시킨다. E. 모델의 예측 정확도, 사용자 피드백, 시스템 로그 등을 분석하여 모델을 개선한다. ① (가)-D ② (나)-A ③ (나)-B ④ (다)-C ⑤ (다)-E

(정답) (해설)

  • (가) 데이터 전처리: 딥러닝 훈련에 사용하기 위한 데이터를 모델이 학습하기 적절한 형식으로 변환한다. 여기서 정규화, 크기 조정, 잡음 제거, 이상치 처리 등을 사용할 수 있다. 이에 대한 설명은 A가 적합하다.
  • (나) 모델 학습: 선택한 딥러닝 모델을 훈련 데이터에 대해 학습시키는 과정을 의미하며, 이 단계에서는 모델이 주어진 데이터에 대해 적절한 예측을 할 수 있도록 가중치를 조정하는 것을 목표로 한다. 이에 대한 설명은 D가 적합하다.
  • (다) 모델 패키징: 모델과 모델을 실행하는 데 필요한 모든 구성 요소를 하나의 패키지로 묶는 프로세스를 말하며, 이는 배포 및 공유가 용이하도록 한다. 이에 대한 설명은 C가 적합하다.
  • B. 데이터에 적합한 알고리즘을 선택하여, 모델의 구조를 설계하는 것은 [특징 분석 및 모델 선택]에 대한 설명으로 적합하다.
  • E. 모델의 예측 정확도, 사용자 피드백, 시스템 로그 등을 분석하여 모델을 개선하는 것은 [모니터링]에 대한 설명으로 적합하다. (배점)4 (난이도)중
  • 문제유형: 선다형
  • 출제영역: 시스템구축> AI시스템 설계 및 배포
  • 문제 제목: AI 모델 배포 프로세스 이해
  • 출제 의도: AI 모델의 개발 및 배포를 위한 프로세스 과정에 대한 이해를 확인한다.

[2025년 Pilot차수] 문항19) 다음 <보기>에서 (A)에 들어갈 알맞은 단어를 영어로 작성하시오. [4점] <보기> **(A)**는 기계 학습 분야의 한 방법으로, 모델이 훈련 중에 본 적 없는 데이터나 클래스에 대해 예측을 수행할 수 있도록 하는 기술이다. 이 기법은 특히 데이터 레이블링 비용이 많이 들거나, 실제 환경에서 예측해야 할 클래스가 훈련 데이터에 모두 포함되지 않는 경우에 유용하다. 최근에는 **(A)**의 확장된 형태인 Generalized **(A)**를 활용하는 방법이 주목받고 있다. 이 방법은 모델이 훈련 중에 본 적 있는 클래스와 본 적 없는 클래스를 동시에 인식할 수 있도록 설계된 기법이다. Generalized **(A)**는 더욱 실용적인 시나리오에서의 활용성을 고려하여 개발되었으며, 실제 환경의 응용에서 더욱 현실적인 문제를 해결하는 데 도움을 준다.

(정답)(A)Zero-shot Learning (해설)(A)는 Zero-shot Learning이다. Zero-shot Learning은 모델이 훈련 데이터에 없는, 본 적 없는 데이터나 클래스를 예측할 수 있게 하는 기술이다. 이는 주로 이미지 분류, 텍스트 분류 등 다양한 분야에서 응용된다. 이 방법은 사전에 정의된 속성을 활용하여 새로운 클래스를 인식하므로, 데이터 수집과 레이블링의 시간 및 비용을 절감할 수 있어서 데이터가 부족하거나 레이블링 비용이 높은 상황에서 유용하게 사용된다. Generalized Zero-shot Learning은 Zero-shot Learning을 한 단계 더 발전시킨 개념으로, 모델이 훈련 데이터에 포함된 클래스와 포함되지 않은 클래스 모두를 인식할 수 있도록 설계되었다. 이는 Zero-shot Learning보다 더 실제적인 시나리오에 가까우며, 모델의 일반화 능력을 크게 향상시킬 수 있다. 구체적으로, Generalized Zero-shot Learning의 최종 목표는 모델이 새로운 클래스에만 치우치지 않고, 이미 알고 있는 클래스와 새로운 클래스 모두에서 균형 잡힌 성능을 보이는 것이다. (배점)4 (난이도)중

  • 문제유형: 단답형
  • 출제영역: 최신 트렌드>최근 주요 AI 기술 발전 트렌드
  • 문제 제목: Zero-shot Learning
  • 출제 의도: 최근 많이 활용되는 딥러닝 방법인 Zero-shot Learning에 대한 개념의 이해를 확인한다.

[2025년 Pilot차수] 문항20) 다음 <보기>에서 (A)에 들어갈 기법을 영어로 쓰시오. [4점] <보기> (A) Prompting 기술은 최근 자연어 처리에서 인기를 얻고 있는 In-context Learning의 한 형태로, 대형 언어 모델이 복잡한 문제를 해결할 때 사용된다. (A) Prompting 기술은 모델이 단순히 직접적인 답변을 생성하는 것이 아니라, 문제를 해결하는 과정에서 흐름을 단계별로 표현하도록 유도한다. 즉, 모델은 주어진 문제를 분석하고, 관련된 여러 하위 문제로 나눈 다음, 각 단계의 해결 과정을 순차적으로 유도할 수 있도록 하여 더 정확한 답변을 도출할 수 있다.

(정답)Chain-of-Thought (해설)Chain-of-Thought Prompting은 언어 모델이 답을 찾아가는 과정에서 “생각을 말로 표현하거나” 단계별 추론 과정을 따르도록 유도하는 방식으로 구성된다. 이를 통해 모델이 사람처럼 복잡한 문제를 해결하는데 도움을 주며, 모델의 추론 능력을 높이고 그 결과를 더 신뢰할 수 있게 만든다. (배점)4 (난이도)중

  • 문제유형: 단답형
  • 출제영역: 최신 트렌드>최근 주요 AI 기술 발전 트렌드
  • 문제 제목: Chain-of-Thought Prompting 이해
  • 출제 의도: 최신 In-context learning 기법인 Chain-of-Thought Prompting 에 대한 이해를 확인한다.

Q: 영훈이는 5개의 쿠키를 가지고 있다. 영훈이는 2개의 쿠키 세트를 더 샀다. 쿠키 세트 1개에는 3개의 쿠키가 들어 있다. 영훈이는 총 몇 개의 쿠키를 가지고 있나? A: 정답은 11개입니다. Q. 베이커리에는 23개의 우유가 있다. 만약 20개를 빵을 만드는데 사용하고 6개를 새로 샀다면, 베이커리에는 총 몇 개의 우유가 남아있나? A: 정답은 27개 입니다. Q: 영훈이는 5개의 쿠키를 가지고 있다. 영훈이는 2개의 쿠키 세트를 더 샀다. 쿠키 세트 1개에는 3개의 쿠키가 들어 있다. 영훈이는 총 몇 개의 쿠키를 가지고 있나? A: 영훈이는 5개의 쿠키로 시작했습니다. 2개의 쿠키세트에는 총 6개의 쿠키가 들어있습니다. 5+6=11. 정답은 11개입니다. Q. 베이커리에는 23개의 우유가 있다. 만약 20개를 빵을 만드는데 사용하고 6개를 새로 샀다면, 베이커리에는 총 몇 개의 우유가 남아있나? A: 베이커리는 원래 23개의 우유가 있습니다. 20개를 빵을 만드는데 사용했습니다. 23-20=3. 6개의 우유를 새로 샀다면, 3+6=9 입니다. 정답은 9입니다. 모델 입력(Input) 모델 출력(Output) 모델 출력(Output) 모델 입력(Input)

[일반적인 Prompting] 정답✓

[(A) Prompting] 정답✘

[2025년 Pilot차수] 문항 21) 연구 팀은 인공지능 모델을 개발하였으나, 실용화를 위해 모델을 최적화하는 작업을 거쳐서 더 높은 정확도와 실시간 처리가 가능한 모델을 설계하려고 한다. 이를 위한 적절한 기법을 찾기 위해 <보기 1>의 내용을 참고하려고 할 때, <보기>에서 (가), (나), (다)에 들어갈 말로 적절한 것을 <보기 2>에서 찾아 쓰시오. <보기 1> **(가)**는 신경망 구조를 자동으로 설계하는 방법으로, 최적의 신경망 아키텍처를 찾기 위해 다양한 신경망 구조를 탐 색하고 평가한다. **(가)**는 딥러닝 모델의 성능을 극대화하고, 전문가의 개입 없이도 최적의 아키텍처를 설계할 수 있 기 때문에 주목받고 있다. **(가)**의 주요 구성 요소는 탐색할 신경망 아키텍처의 범위를 정의하는 (나), **(나)**에서 최적 의 아키텍처를 찾는 검색 방법(search strategy), 그리고 각 아키텍처의 성능을 평가하는 방법으로 이루어져 있다. **(다)**는 **(가)**의 대표적인 한 방법으로, 기존의 높은 계산 비용 문제를 해결하고, 더 빠르고 효율적인 아키텍처 탐색 을 가능하게 한다. **(다)**는 기존에는 이산적(discrete)이고 미분불가능한 **(나)**를 다뤘던 기존 접근법들과는 다르게, **(나)**를 미분 가능한 연속적인 공간(continuous space)으로 만들어 경사 하강법(gradient descent)을 통해 효율적 인 네트워크 구조를 탐색할 수 있도록 한 혁신적인 모델이다. <보기 2> ㄱ) Reinforcement Learning ㄴ) Bayesian Optimization ㄷ) DARTS ㄹ) NAS ㅁ) DQN ㅂ) PPO ㅅ) 보상 공간(Reward Space) ㅇ) 상태 공간(State Space) ㅈ) 탐색 공간(Search Space) ※ 작성 예시

  1. (가)에 해상하는 내용을 보기 2에서 골라 기호를 기입 (예시: ㄱ)
  2. (나)에 해상하는 내용을 보기 2에서 골라 기호를 기입 (예시: ㄴ)
  3. (다)에 해상하는 내용을 보기 2에서 골라 기호를 기입 (예시: ㄷ)

(정답)1): ㄹ, 2) : ㅈ, 3) : ㄷ (해설)(가)에 해당하는 말은 NAS 로, NAS는 최적의 신경망 구조를 자동으로 설계하여, 딥러닝 모델의 성능을 극대화할 수 있는 기법이다. **(나)에 해당하는 말은 검색 공간(Search Space)**으로, 검색 공간은 다양한 신경망 구조의 범위를 정의하며, NAS가 최적의 신경망 아키텍처를 찾기 위해 탐색하는 영역을 의미한다. **(다)에 해당하는 말은 DARTS(Differentiable Architecture Search)**로, DARTS는 NAS의 한 방법으로, 탐색 공간을 미분 가능한 연속적인 공간으로 변환하여 경사 하강법을 통해 최적의 신경망 아키텍처를 효율적으로 탐색하는 기법을 의미한다. (배점)4 점 (난이도)상

  • 문제유형: 단답형
  • 출제영역 대분류>소분류: AI 모델 개발>AI 모델 아키텍처 설계
  • 출제구분: 신규
  • 문제 제목: NAS 와 DARTS
  • 출제 의도: NAS 의 개념과 대표적인 방법인 DARTS 에 대한 이해 확인한다.

[2025년 Pilot차수] 문항22) 아래 그림 내에 두 그래프 (가), (나)는 다른 학습전략을 사용하여 같은 구조의 모델을 학습했을 때의 손실 함수(Loss function)이 학습 epoch에 따라서 어떻게 변하는 지를 학습 데이터셋(Training dataset)과 검증 데이터셋(Validation dataset)에 대해서 나타낸 것이다. 아래 그래프에 대해서 더 좋은 성능을 얻기 위해 학습전략을 최적화를 하기 위한 방안으로 알맞은 것을 <보기>에서 모두 고른 것은? (두 그래프 (가), (나) 이미지) <보기> ㄱ. (가)의 경우 학습 시 임의의 뉴런(Neuron)의 연결을 삭제하며 학습한다. ㄴ. (나)의 경우 손실함수(Loss function)에 모델 파라미터의 𝐿2-norm 을 추가해서 모델 파라미터가 더 작은 값을 가지도록 유도한다. ㄷ. (가)의 경우 배치(Batch) 단위 데이터의 분포를 재조정한다. 배치단위 데이터의 평균 (Mean)을 0 으로 분산(Variance)을 1 로 만든 후 스케일링(Scaling)하고 시프팅(Shifting)한다. ㄹ. (나)의 경우 중첩되는 레이어(Layer)의 개수를 줄여서 모델의 파라미터의 개수를 줄인다. ① ㄱ, ㄴ ② ㄱ, ㄷ ③ ㄴ, ㄷ ④ ㄱ, ㄷ, ㄹ ⑤ ㄱ, ㄴ, ㄹ

(정답) (해설)(가)는 학습 데이터의 loss 는 잘 줄어들지만 검증 데이터와의 차이가 벌어지는 것을 보아 모델이 과적합(Overfitting)되었고, (나)는 모델이 너무 단순하거나 정규화(Regularization)가 과하게 걸려있어 목표 성능에 도달하지 못하는 과소적합(Underfitting)상태이다.

  • ㄱ. 학습 시 임의의 뉴런(neuron)의 연결을 삭제하며 학습하는 방법을 드롭아웃(Dropout)이라고 하며, 이는 과적합을 방지할 수 있다. 따라서 (가)에 대한 해결방안으로 알맞다. (옳은 설명)
  • ㄴ. 손실함수(Loss function)에 모델 파라미터의 𝐿2-norm을 추가해서 모델 파라미터가 더 작은 값을 가지도록 유도하는 방법을 𝐿2 Regularization이라고 하며 이는 과대적합을 방지하는 방법으로 (나)가 아닌 (가)에 대한 해결방안으로 적절하다. (틀린 설명)
  • ㄷ. 배치(Batch)단위의 분포를 조정하는 것으로 과적합을 방지할 수 있다. 이를 배치 정규화(Batch normalization)라고 한다. 배치의 평균(Mean)과 분산(Variance)를 정규화(Normalization)한 후 스케일링(Scaling)하고 시프팅(Shifting)한다. 따라서 (가)에 대한 해결방안으로 알맞다. (옳은 설명)
  • ㄹ. 중첩되는 레이어(Layer)의 개수를 줄여서 모델의 파라미터의 개수를 줄이는 것은 과적합을 방지하는 방법으로 (나)가 아닌 (가)에 대한 해결방안으로 적절하다. (나)의 경우에는 모델의 파라미터 개수를 늘려서 복잡하게 만들어야 한다. (틀린 설명) (배점)4 (난이도)중
  • 문제유형: 선다형
  • 출제영역 대분류>소분류: AI 모델 개발>AI 모델 아키텍처 설계
  • 출제구분: 신규
  • 문제 제목: Learning curve 를 통한 학습전략 최적화
  • 출제 의도: Learning curve 를 보고 적절한 학습전략을 선택하여 AI 시스템을 최적화할 수 있는지를 평가한다.

[2025년 Pilot차수] 문항23) 인공지능 개발 팀은 음성 비서 애플리케이션에서 사용될 음성 인식 모델이 실시간으로 잘 동작하도록 개발하였다. <보기1>의 (가)가 현재 모델의 성능일 때, 개발 팀은 모델이 (나)의 성능에 도달할 수 있도록 수정하려고 한다. <보기 2>에서 적용해볼 수 있는 방법으로 옳은 것을 모두 고른 것은? <보기 1>

모델FLOPsTop-1 err. (%)

(가) 3.8G 24.0
(나) 2.3G 24.0

<보기 2> ㄱ. 모델의 가중치나 뉴런 중에서 상대적으로 불필요하거나 중요하지 않은 부분을 제거 ㄴ. 데이터 증강기법을 통해 모델이 더 많은 학습 데이터를 사용하여 복잡한 패턴을 학습하도록 함 ㄷ. 네트워크의 깊이, 너비, 해상도를 균형 있게 조절하여 효율성을 극대화하는 컴파운드 스케일링(Compound Scaling) 도입 ㄹ. 모델을 더 깊이 쌓은 후, 깊은 네트워크를 안정적으로 학습할 수 있도록 잔차 연결(residual connections)을 도입 ① ㄱ,ㄴ ② ㄱ,ㄷ ③ ㄴ,ㄷ ④ ㄴ,ㄷ,ㄹ ⑤ ㄱ,ㄴ,ㄷ

(정답) (해설)<보기 1>의 (가)성능과 비교해 (나)를 확인해보면 FLOPs 지표가 내려간 것을 확인할 수 있다. 따라서 인공지능 개발 팀은 모델의 경량화에 목표를 두고 있다.

  • ㄱ. 모델의 가중치나 뉴런 중에서 상대적으로 불필요한 부분을 제거하는 가지치기 (pruning)는 대표적인 모델 경량화 방법이다. (옳은 설명)
  • ㄴ. 데이터 증강 기법은 모델의 일반화 능력을 높이지만 모델의 경량화와는 거리가 먼 방법이다. (틀린 설명)
  • ㄷ. 컴파운드 스케일링(Compound Scaling) 방법은 Efficient Net 모델에서 소개된 대표적인 모델 경량화 방법이다. (옳은 설명)
  • ㄹ. 네트워크를 깊이 쌓고 잔차 연결을 도입하는 방법은 오히려 모델의 복잡도를 향상시킨다. (틀린 설명) 따라서 옳은 것은 ㄱ,ㄷ이다. (배점)4 (난이도)중
  • 문제유형: 선다형
  • 출제영역 대분류>소분류: AI 모델 개발>AI 모델 학습 및 평가
  • 출제구분: 신규
  • 문제 제목: FLOPs 성능과 경량화 기법
  • 출제 의도: 모델의 복잡도 지표 중 FLOPS 와 경량화 기법들에 대한 이해 확인한다.

[2025년 Pilot차수] 문항24) MLOps는 머신러닝 모델의 생명주기 전반에 걸쳐 모델을 효과적으로 관리하고 운영하기 위한 프로세스이다. MLOps는 모델 빌드와 배포를 효과적으로 관리하기 위해 다양한 도구와 프로세스를 포함할 수 있고 자동화가 얼마나 되어있는지에 따라서 수준을 나눌 수 있다. 아래 그림은 MLOps에서 수준이 다른 두 예시를 나타낸 것이다. 그림에 대한 다음 설명 각각에 대해 알맞은 내용은 O, 알맞지 않은 내용은 X를 고르시오. (답안 작성 예: O,X,O,X) [4점] (MLOps 수준이 다른 두 예시 그림 이미지)

  1. (가)는 데이터 분석부터 모델 검증까지 포함한 모든 단계별 전환이 수동으로 이뤄지지만 (나)는 단계별 전환이 자동이므로 이뤄진다. ( O / X )
  2. 학습 시 성능과 서빙 중 성능의 차이가 나는 문제 학습-서빙 편향(training-serving skew)이라고 하며 이를 (가)와 (나) 모두에서 오프라인 데이터 학습을 통해서 효과적으로 줄일 수 있다. ( O / X )
  3. (나)는 새 데이터가 들어올 때마다 지속적으로 ML 파이프라인의 빌드와 배포를 하기 위한 CI/CD 자동화가 가능하나 (가)는 불가능하다. ( O / X )
  4. (가), (나)는 모두 모델 서빙 후 모델 성능 저하를 감지할 수 없어 모델 서빙 후 간헐적인 재학습이 필요하다. ( O / X )

(정답)O,X,X,X (해설)(가)는 MLOps에서 수동 프로세스에 해당하는 수준 0을 나타내고 (나)는 ML 파이프라인은 자동화한 수준 1을 나타낸다. 각 문항에 대한 설명은 아래와 같다.

  1. (가)는 데이터 분석부터 모델 검증까지 실험과 배포를 포함한 모든 단계별 전환이 수동으로 이뤄지지만 (나)는 단계별 전환이 자동이므로 이뤄진다. 이를 통해 모델을 지속적으로 제공할 수 있다. (O)
  2. 학습 시 성능과 서빙 중 성능의 차이를 학습-서빙 편향(training-serving skew)이라고 하는 것은 맞으나 이를 오프라인 학습을 통해서 해결할 수 없다. (나)에서는 Feature Store와 같은 방법으로 해결하지만, (가)는 해결할 수 없다. (X)
  3. (가)와 (나) 둘 다 CI/CD 파이프라인 자동화가 되어있지 않는다. (X)
  4. (가)는 모델 서빙 후 모델 성능 저하를 감지할 수 없어 간헐적인 재학습이 필요할 수 있으나 (나)는 모니터링을 통해서 감지할 수 있다. (X) (배점)4 (난이도)중
  • 문제유형: 단답형
  • 출제영역 대분류>소분류: 시스템구축>AI시스템 최적화
  • 문제 제목: MLOps 자동화 파이프라인
  • 출제 의도: MLOps 에서 모델을 빌드하고 배포하는 프로세스에서 수동 프로세스와 ML 프로세스 자동화에 대한 이해를 확인한다.

반응형