NLP Insights สำหรับ Penguin Café Orchestra

โหนดต้นทาง: 1062837

NLP Insights สำหรับ Penguin Café Orchestra

เรายกตัวอย่างวิธีใช้ Expert.ai และ Python เพื่อตรวจสอบอัลบั้มเพลงโปรด


โพสต์ที่ได้รับการสนับสนุน

โดย Laura Gorrieri, expert.ai

โปรดค้นหาเวอร์ชันโน้ตบุ๊กของกระทู้นี้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

มาสร้างแอปพลิเคชันขนาดเล็กเพื่อตรวจสอบศิลปินคนโปรดของฉัน พวกเขาถูกเรียกว่า “เดอะ เพนกวิน คาเฟ่ ออเคสตรา” และถ้าคุณไม่รู้จักพวกเขา คุณจะพบว่าพวกเขาเกี่ยวกับอะไร

ชุดข้อมูลของเรา: รายการบทวิจารณ์อัลบั้มของพวกเขาที่ฉันนำมาจากเว็บไซต์ของ Piero Scaruffi และบันทึกไว้ในโฟลเดอร์เฉพาะ

เป้าหมายของพวกเรา: เพื่อทำความเข้าใจเพิ่มเติมเกี่ยวกับศิลปินโดยใช้บทวิจารณ์อัลบั้ม

เป้าหมายในทางปฏิบัติของเรา: ดูวิธีการ NL API ของผู้เชี่ยวชาญ.ai ทำงานและทำอะไรได้บ้าง

The Penguin Café Orchestra เกี่ยวกับอะไร?

ขั้นแรก เรามาดูสิ่งที่ออกมาจากบทวิจารณ์เพียงแค่วิเคราะห์คำที่ใช้ในคำวิจารณ์เหล่านั้น ก่อนอื่น เราจะรวมบทวิจารณ์ทั้งหมดไว้ในตัวแปรเดียว เพื่อที่จะได้มีบทวิจารณ์จากศิลปินทั้งหมด จากนั้นเราจะมาดูคำศัพท์ที่ใช้บ่อยที่สุดโดยหวังว่าจะเปิดเผยเพิ่มเติมใน Penguin Café Orchestra

## รหัสสำหรับการวนซ้ำในโฟลเดอร์ของศิลปินและเชื่อมโยงความคิดเห็นของอัลบั้มในการวิจารณ์ของศิลปินคนเดียว
นำเข้า os artist_review = '' artist_path = 'penguin_cafe_orchestra' อัลบั้ม = os.listdir (artist_path) for
 อัลบั้ม in อัลบั้ม: album_path = os.path.join (artist_path, อัลบั้ม)
      กับ เปิด (album_path, 'r', การเข้ารหัส = 'utf8') as ไฟล์: รีวิว = file.read() artist_review += รีวิว

โดยใช้วิธีการแบบตื้น-ภาษาศาสตร์ เราสามารถตรวจสอบบทวิจารณ์ของศิลปิน ซึ่งมีบทวิจารณ์ที่มีอยู่ทั้งหมด ในการทำเช่นนั้น เราใช้ matplotlib และ word cloud เพื่อสร้าง word cloud ที่จะบอกเราเพิ่มเติมเกี่ยวกับคำที่ใช้บ่อยที่สุดในข้อความ

 
#แพ็คเกจนำเข้า

นำเข้า matplotlib.pyplot as plt %matplotlib แบบอินไลน์ # กำหนดฟังก์ชั่นเพื่อพล็อตคำ cloud
def พล็อต_คลาวด์(เวิร์ดคลาวด์): # กำหนดขนาดรูป plt.figure(รูป=(30, 10)) # แสดงภาพ plt.imshow (เวิร์ดคลาวด์) # ไม่มีรายละเอียดแกน plt.axis("ปิด"); #แพ็คเกจนำเข้า
ราคาเริ่มต้นที่ เวิร์ดคลาวด์ นำเข้า เวิร์ดคลาวด์, คำหยุด # สร้างคลาวด์คำ
wordcloud = WordCloud (ความกว้าง = 3000, ความสูง = 2000, random_state = 1, background_color='white', การจัดเรียง =เท็จ, คำหยุด = STOPWORDS). สร้าง (artist_review) # พล็อต
plot_cloud (เวิร์ดคลาวด์)

ผู้เชี่ยวชาญ Ai Penguin Cafe Word Cloud

รูปที่ 1: word cloud ซึ่งคำที่ใช้มากที่สุดจะปรากฏในแบบอักษรที่ใหญ่กว่าและคำที่ใช้น้อยกว่าในแบบอักษรที่เล็กกว่า

เพลงของพวกเขาทำให้คุณรู้สึกอย่างไร?

ขอบคุณคำว่า cloud ทำให้เรารู้จัก The Penguin Café Orchestra มากขึ้น เรารู้ว่าพวกเขาใช้เครื่องดนตรี เช่น อูคูเลเล่ เปียโน และไวโอลิน และพวกเขาผสมผสานแนวเพลงต่างๆ เช่น โฟล์ค ชาติพันธุ์ และคลาสสิก

ถึงกระนั้นเราไม่มีความคิดเกี่ยวกับสไตล์ของศิลปิน เราสามารถรู้ได้มากขึ้นโดยดูจากอารมณ์ที่ออกมาจากงานของพวกเขา

ในการทำเช่นนั้น เราจะใช้ NL API ของ expert.ai กรุณาลงทะเบียน โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม, ค้นหาเอกสารใน SDK โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม และคุณสมบัติ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.

### ติดตั้ง python SDK

!pip ติดตั้งผู้เชี่ยวชาญ-nlapi ## รหัสสำหรับการเริ่มต้นไคลเอนต์แล้วใช้อนุกรมวิธานลักษณะทางอารมณ์ นำเข้า os ราคาเริ่มต้นที่ Expertai.nlapi.cloud.client นำเข้า ลูกค้า ExpertAiClient = ExpertAiClient() os.environ["EAI_USERNAME"] = 'your_username' os.environ["EAI_PASSWORD"] = 'your_password' อารมณ์ =[] น้ำหนัก = [] เอาต์พุต = client.classification(body={"document" : {"text": artist_review}}, params={'taxonomy': 'emotional-traits', 'language': 'en'}) for
 หมวดหมู่ in output.categories: อารมณ์ = หมวดหมู่ น้ำหนัก = หมวดหมู่ ความถี่ อารมณ์ ผนวก (อารมณ์) น้ำหนัก ผนวก (น้ำหนัก) พิมพ์ (อารมณ์) พิมพ์ (น้ำหนัก)


['ความสุข', 'ความตื่นเต้น', 'ความสุข', 'ความสนุก', 'ความรัก']
[15.86, 31.73, 15.86, 31.73, 4.76]

สำหรับการดึงตุ้มน้ำหนัก เราใช้ "ความถี่" ซึ่งจริงๆ แล้วเป็นเปอร์เซ็นต์ ผลรวมของความถี่ทั้งหมดคือ 100 ซึ่งทำให้ความถี่ของอารมณ์เป็นตัวเลือกที่ดีสำหรับแผนภูมิวงกลม ซึ่งวางแผนโดยใช้ matplotlib

# นำเข้าห้องสมุด

ราคาเริ่มต้นที่ matplotlib นำเข้า แผนภาพ as plt
นำเข้า มึน as np #สร้างโครงเรื่อง
สี = ['#0081a7','#2a9d8f','#e9c46a','#f4a261', '#e76f51'] fig = plt.figure(figsize =(10, 7)) plt.pie(weights, labels = อารมณ์, สี=สี, autopct='%1.1f%%') #โครงเรื่อง
plt.show ()

ผู้เชี่ยวชาญ Ai Pie Chart
รูปที่ 2: แผนภูมิวงกลมที่แสดงอารมณ์แต่ละอารมณ์และเปอร์เซ็นต์

อัลบั้มที่ดีที่สุดของพวกเขาคืออะไร?

หากคุณต้องการเริ่มฟังพวกเขา เพื่อดูว่าคุณรู้สึกอารมณ์เดียวกับที่สคารัฟฟิสพบในงานของพวกเขาหรือไม่ คุณจะเริ่มที่ไหน เราสามารถดูการวิเคราะห์ความเชื่อมั่นของแต่ละอัลบั้มและหาไอเดียที่ดีที่สุดของพวกเขาได้ ในการทำเช่นนั้น เราได้ทบทวนแต่ละอัลบั้มซ้ำแล้วซ้ำเล่า และใช้ expert.ai NL API เพื่อดึงเอาความรู้สึกและความแข็งแกร่งของอัลบั้มกลับมา

## รหัสสำหรับวนซ้ำในแต่ละอัลบั้มและดึงความรู้สึก

sentiment_ratings = [] albums_names = [อัลบั้ม[:-4] for
 อัลบั้ม in อัลบั้ม] for
 อัลบั้ม in อัลบั้ม: album_path = os.path.join (artist_path, อัลบั้ม) กับ เปิด (album_path, 'r', การเข้ารหัส = 'utf8') as ไฟล์: ตรวจสอบ = file.read() เอาต์พุต = client.specific_resource_analysis( body={"document": {"text": review}}, params={'language': 'en', 'resource': 'sentiment' } ) ความรู้สึก = output.sentiment.overall sentiment_ratings.append (sentiment) พิมพ์ (albums_names) พิมพ์ (sentiment_ratings)

['Broadcasting From Home', 'Concert Program', 'Music From the Penguin Cafe', 'Signs of Life']
[11.6, 2.7, 10.89, 3.9]

 

ตอนนี้เราสามารถแสดงภาพความรู้สึกสำหรับแต่ละรีวิวได้โดยใช้แผนภูมิแท่ง สิ่งนี้จะให้คำติชมอย่างรวดเร็วเกี่ยวกับอัลบั้มที่ดีที่สุดของ The Penguin Cafe Orchestra และเกี่ยวกับอาชีพของพวกเขา ในการทำเช่นนั้น เราใช้ matplotlib อีกครั้ง

นำเข้า matplotlib.pyplot as plt plt.style.use('ggplot') albums_names = [ชื่อ[:-4] for
 ชื่อ in อัลบั้ม] plt.bar(albums_names, sentiment_ratings, color='#70A0AF') plt.ylabel("Album Rating") plt.title("การจัดอันดับอัลบั้มของ Penguin Cafe Orchestra") plt.xticks(albums_names, rotation=70) plt .แสดง()

แผนภูมิแท่งจัดอันดับผู้เชี่ยวชาญ Ai

โพสต์ครั้งแรก โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม.



เรื่องเด่นใน 30 วันที่ผ่านมา
เป็นที่นิยม
  1. ความแตกต่างระหว่างนักวิทยาศาสตร์ข้อมูลและวิศวกร ML
  2. 3 เหตุผลที่คุณควรใช้แบบจำลองการถดถอยเชิงเส้นแทนโครงข่ายประสาทเทียม
  3. คำถามและคำตอบในการสัมภาษณ์วิทยาศาสตร์ข้อมูลทั่วไปส่วนใหญ่
  4. GitHub Copilot โอเพ่นซอร์สทางเลือก
  5. คำแนะนำสำหรับการเรียนรู้ Data Science จากผู้อำนวยการฝ่ายวิจัยของ Google
แบ่งปันมากที่สุด
  1. ความแตกต่างระหว่างนักวิทยาศาสตร์ข้อมูลและวิศวกร ML
  2. วิธีค้นหาดาต้าเฟรมของ Pandas
  3. ทำไมคุณควรเรียนรู้ "Productive Data Science" และอย่างไร
  4. ไม่เพียงแต่สำหรับ Deep Learning เท่านั้น: GPUs เร่งความเร็ว Data Science & Data Analytics ได้อย่างไร
  5. การเขียนแอปพลิเคชัน Python แบบกระจายครั้งแรกของคุณด้วย Ray

ที่มา: https://www.kdnuggets.com/2021/08/expert-nlp-insights-music.html

ประทับเวลา:

เพิ่มเติมจาก KD นักเก็ต