본문 바로가기

알고리즘

[프로그래머스] #해시 #Level3 베스트앨범

반응형

문제 설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.

입출력 예

genres plays return
[classic, pop, classic, classic, pop] [500, 600, 150, 800, 2500] [4, 1, 3, 0]

입출력 예 설명

classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.

  • 고유 번호 3: 800회 재생
  • 고유 번호 0: 500회 재생
  • 고유 번호 2: 150회 재생

pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.

  • 고유 번호 4: 2,500회 재생
  • 고유 번호 1: 600회 재생

따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.

※ 공지 - 2019년 2월 28일 테스트케이스가 추가되었습니다.

나의 풀이

from collections import defaultdict

def solution(genres, plays):
    answer = []
    total  = []
    new_genres = defaultdict(int)
    
    for index, (genre, play) in enumerate(zip(genres, plays)):
        total.append([index, genre, play])
        new_genres[genre] += play
        
    total = sorted(total, key=lambda entry: entry[2], reverse=True)
    new_genres = sorted(new_genres.items(), key=lambda entry: entry[1], reverse=True)
    
    for genre, _ in new_genres:
        count = 0
        for entry in total:
            if genre == entry[1]:
                answer.append(entry[0])
                entry[1] = ''
                
                count += 1
                if count == 2:
                    break
    
    return answer

남의 풀이

def solution(genres, plays):
    answer = []
    d = {e:[] for e in set(genres)}
    for e in zip(genres, plays, range(len(plays))):
        d[e[0]].append([e[1] , e[2]])
    genreSort =sorted(list(d.keys()), key= lambda x: sum( map(lambda y: y[0],d[x])), reverse = True)
    for g in genreSort:
        temp = [e[1] for e in sorted(d[g],key= lambda x: (x[0], -x[1]), reverse = True)]
        answer += temp[:min(len(temp),2)]
    return answer

관건은 (장르, 인덱스, 플레이)로 이루어진 해시와 (장르, 총액)으로 이뤄진 해시 만들기입니다.

남의 풀이 리팩토링

def solution(genres, plays):
    answer = []
    genreHash = {genre:[] for genre in set(genres)}
    for index, (genre, play) in enumerate(zip(genres, plays)):
        genreHash[genre].append([play, index])
        
    genreSort = sorted(list(genreHash.keys()),
                       key=lambda genre: sum([play for play, index in genreHash[genre]]),
                       reverse=True)
    for genre in genreSort:
        playlist = [index for _, index in
            sorted(genreHash[genre],
            key=lambda play_index: (play_index[0], -play_index[1]),
            reverse=True)]
        answer += playlist[:2]
    return answer

난독화 된 부분을 나름대로 변수 이름을 넣어 살려봤습니다. 코드를 간단하게 짜기 위해 람다를 활용하는 경우가 많은데, 람다를 사용할 경우 변수명을 알아보기 힘들거나, play_index처럼 변수명이 지저분해지는 경우가 생기는 것 같습니다. for index, (genre, play) in으로는 가능한데, lambda play, index:, lambda (play, index):처럼 튜플, 리스트 형태의 변수를 나눠서 받는 것이 불가능합니다.

반응형