ペンギンカフェオーケストラのためのNLPインサイト

ソースノード: 1062837

ペンギンカフェオーケストラのためのNLPインサイト

Expert.aiとPythonを使用してお気に入りの音楽アルバムを調査する方法の例を示します。


スポンサー付きポスト。

ローラ・ゴリエリ、expert.ai

このスレッドのノートブックバージョンを見つけてください こちら.

私のお気に入りのアーティストのXNUMX人を調査するための小さなアプリケーションを作成しましょう。 という "ペンギンカフェオーケストラ」とあなたがそれらを知らない場合、あなたはそれらが何であるかを知るつもりです。

私たちのデータセット:Piero ScaruffiのWebサイトから取得し、専用のフォルダーに保存したアルバムのレビューのリスト。

私たちの目標:アルバムレビューを使用してアーティストについて詳しく理解する。

私たちの実際的な目標:方法を確認する Expert.aiのNLAPI 動作し、それが何ができるか。

ペンギンカフェオーケストラとは何ですか?

まず、レビューで使用されている単語を分析するだけで、レビューから何が得られるかを見てみましょう。 アーティスト全体のレビューを得るために、最初にすべてのレビューをXNUMXつの変数に連結します。 次に、ペンギンカフェオーケストラでさらに明らかになることを期待して、それらの中で最も頻繁に使用される単語を見ていきます。

##アーティストのフォルダを反復処理し、アルバムのレビューをXNUMX人のアーティストのレビューに連結するためのコード
import os artist_review = '' artist_path = 'penguin_cafe_orchestra' albums = os.listdir(artist_path) for アルバム in アルバム:album_path = os.path.join(artist_path、album)
        open(album_path、 'r'、encoding = 'utf8') as ファイル:レビュー= file.read()artist_review + =レビュー

浅い言語学のアプローチを使用して、利用可能なすべてのレビューを含むアーティストレビューを調査できます。 そのために、matplotlibとword cloudを使用して、テキスト内で最も頻繁に使用される単語について詳しく説明する単語クラウドを作成します。

 
#パッケージをインポートする

import matplotlib.pyplot as plt%matplotlibインライン #ワードクラウドをプロットする関数を定義する
def プロットクラウド(wordcloud): #図形サイズを設定する plt.figure(figsize =(30、10)) #画像を表示 plt.imshow(wordcloud) #軸の詳細なし plt.axis( "off"); #パッケージをインポート
から ワードクラウド import WordCloud、STOPWORDS #ワードクラウドを生成する
wordcloud = WordCloud(width = 3000、height = 2000、random_state = 1、background_color = 'white'、collocations =×、stopwords = STOPWORDS).generate(artist_review) #プロット
plot_cloud(wordcloud)

エキスパートアイペンギンカフェワードクラウド

図1:使用頻度の高い単語が大きいフォントで表示され、使用頻度の低い単語が小さいフォントで表示される単語クラウド。

彼らの音楽はあなたをどのように感じさせますか?

クラウドという言葉のおかげで、ペンギンカフェオーケストラについてもっと知ることができます。 ウクレレ、ピアノ、バイオリンなどの楽器を使用しており、フォーク、エスニック、クラシックなどのジャンルが混在していることはわかっています。

それでも、アーティストのスタイルはわかりません。 彼らの仕事からどんな感情が生まれるのかを見れば、もっと知ることができます。

そのために、expert.aiのNLAPIを使用します。 登録してください こちら、SDKでドキュメントを検索します こちら と機能について こちら.

### PythonSDKをインストールします

!pip install Expertai-nlapi ##クライアントを初期化し、感情特性分類法を使用するためのコード import os から Expertai.nlapi.cloud.client import ExpertAiClientクライアント= ExpertAiClient()os.environ ["EAI_USERNAME"] = 'your_username' os.environ ["EAI_PASSWORD"] = 'your_password'感情= []重み= []出力= client.classification(body = {"document" :{"text":artist_review}}、params = {'taxonomy': 'emotional-traits'、 'language': 'en'}) for カテゴリ in output.categories:emotion = category.label weight = category.frequency energys.append(emotion)weights.append(weight)print(emotions)print(weights)


[「幸福」、「興奮」、「喜び」、「娯楽」、「愛」]
[15.86、31.73、15.86、31.73、4.76]

重みを取得するために、実際にはパーセンテージである「頻度」を使用しました。 すべての頻度の合計は100です。これにより、感情の頻度は、matplotlibを使用してプロットされる円グラフの適切な候補になります。

#ライブラリをインポートする

から matplotlib import ピプロット as plt
import numpy as np #プロットを作成する
色= ['#0081a7'、 '#2a9d8f'、 '#e9c46a'、 '#f4a261'、 '#e76f51'] fig = plt.figure(figsize =(10、7))plt.pie(weights、labels =感情、色=色、autopct = '%1.1f %%') #プロットを表示
plt.show()

エキスパートAi円グラフ
図2:各感情とその割合を表す円グラフ。

彼らの最高のアルバムは何ですか?

彼らの話を聞き始めたいのなら、スカルフィスが彼らの作品で見つけたのと同じ感情を感じているかどうかを確かめるために、どこから始めればよいでしょうか? 各アルバムの感情分析を見て、彼らの最高のアルバムのアイデアを得ることができます。 そのために、各アルバムのレビューを繰り返し、expert.ai NLAPIを使用してアルバムの感情と強さを取得します。

##各アルバムを繰り返して感情を取得するためのコード

sentiment_ratings = [] albums_names = [album [:-4] for アルバム in アルバム] for アルバム in アルバム:album_path = os.path.join(artist_path、album)   open(album_path、 'r'、encoding = 'utf8') as file:review = file.read()output = client.specific_resource_analysis(body = {"document":{"text":review}}、params = {'language': 'en'、 'resource': 'sentiment'} )sentiment = output.sentiment.overall sentiment_ratings.append(sentiment)print(albums_names)print(sentiment_ratings)

[「自宅からの放送」、「コンサートプログラム」、「ペンギンカフェからの音楽」、「生命の兆候」]
[11.6、2.7、10.89、3.9]

 

これで、棒グラフを使用して各レビューの感情を視覚化できます。 これにより、ペンギンカフェオーケストラのベストアルバムとそのキャリアに関する視覚的なフィードバックがすばやく得られます。 そのために、もう一度matplotlibを使用します。

import matplotlib.pyplot as plt plt.style.use( 'ggplot')albums_names = [name [:-4] forin アルバム] plt.bar(albums_names、sentiment_ratings、color = '#70A0AF')plt.ylabel( "アルバム評価")plt.title( "ペンギンカフェオーケストラのアルバムの評価")plt.xticks(albums_names、rotation = 70)plt 。見せる()

エキスパートAI評価棒グラフ

当初投稿 こちら.

出典:https://www.kdnuggets.com/2021/08/expert-nlp-insights-music.html

タイムスタンプ:

より多くの KDナゲット