0% found this document useful (0 votes)

5 views7 pages

Micro Genai

The document outlines various tasks involving word embeddings, including exploring pre-trained vectors, visualizing embeddings, training a custom Word2Vec model, and using embeddings to enhance prompts for Generative AI models. It includes code examples for performing these tasks using libraries like Gensim and Transformers, as well as techniques for sentiment analysis and text summarization. The document emphasizes the application of word embeddings in different domains and creative tasks.

Uploaded by

chiragmohite02

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views7 pages

Micro Genai

Uploaded by

chiragmohite02

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

1. Explore pre-trained word vectors. Explore word relationships using vector arithmetic.

Perform arithmetic operations and

analyze results.

!pip install gensim

from [Link] import load

print("Loading pre-trained Glove model (50 Dimensions)___")

model= load("glove-wiki-gigaword-50")

def explore_world_vectors():

result=model.most_similar(positive=['woman','king'],negative=['man'],topn=1)

print("\n king-man+woman=", result[0][0])

print("Similarity Score:",result[0][1])

result=model.most_similar(positive=['paris','italy'],negative=['france'],topn=1)

print("\n france-paris+italy=", result[0][0])

print("Similarity Score:",result[0][1])

result=model.most_similar(positive=['programming'],topn=5)

print("\n Top 5 words similar to 'programming':")

for word,similarity in result:

print(word,similarity)

result=model.most_similar(positive=['king','young'], negative=['adult'],topn=1)

print("\n king-adult+young=",result[0][0])

print("Similarity Score:",result[0][1])

explore_world_vectors()
2. Use dimensionality reduction (e.g., PCA or t-SNE) to visualize word embeddings for Q 1. Select 10 words from a specific
domain (e.g., sports, technology) and visualize their embeddings. Analyze clusters and relationships. Generate contextually rich
outputs using embeddings. Write a program to generate 5 semantically similar words for a given input.

!pip install gensim matplotlib scikit-learn

import [Link] as api

import [Link] as plt

from [Link] import PCA

model=[Link]("glove-wiki-gigaword-50")

words= ["computer","software","hardware","internet","network","data","ai","programming","algorithm","cloud"]

vectors=[model[word] for word in words]

pca=PCA(n_components=2)

reduced_vectors=pca.fit_transform(vectors)

[Link](figsize=(8,6))

for i,word in enumerate(words):

[Link](reduced_vectors[i][0], reduced_vectors[i][1])

[Link](reduced_vectors[i][0]+0.01, reduced_vectors[i][1]+0.01, word)

[Link]("PCA Visualization of Technology Word Embeddings")

[Link]('PCA Compponent 1')

[Link]('PCA Component 2')

[Link]()

Similar_words=model.most_similar("programming",topn=5)

print("Top 5 similar words to 'programming':")

for word,score in Similar_words:

print(word,score)
3. Train a custom Word2Vec model on a small dataset. Train embeddings on a domain-specific corpus (e.g., legal, medical) and
analyze how embeddings capture domain-specific semantics.

!pip install gensim

from [Link] import Word2Vec

Sentences=[

"the doctors examined the patient",

"the patient was diagnosed with diabetes",

"the doctor prescribed medicine",

"nedicinal treatment improves patient health",

"the hospital provides medical care",

"nurses assist the doctor during treatment",

"the diagnosis helps in treatment planning"

tokenized_sentences=[[Link]() for sentence in Sentences]

model=Word2Vec(sentences=tokenized_sentences,vector_size=50,window=5,min_count=1,workers=4)

print("\n Words similar to 'doctor':")

similar_words=[Link].most_similar("doctor",topn=5)

for word,score in similar_words:

print(word,score)

print("\n Words similar to 'treatment':")

similar_words=[Link].most_similar("treatment",topn=5)

for word,score in similar_words:

print(word,score)
4. Use word embeddings to improve prompts for Generative AI model. Retrieve similar words using word embeddings. Use the
similar words to enrich a GenAI prompt. Use the AI model to generate responses for the original and enriched prompts. Compare
the outputs in terms of detail and relevance.

!pip install numpy sentence_transformers scikit-learn transformers

import numpy as np

from sentence_transformers import SentenceTransformer

from [Link] import cosine_similarity

from transformers import pipeline

embedding_model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')

corpus=["global warming","greenhouse effect","carbon emissions","fossil fuels","rising temperatures","extreme weather","sea-

level rises","climate crisis","environmental impact","sustainability","renewable energy","deforestation","methane
emission","carbon footprint"]

corpus_embeddings=embedding_model.encode(corpus)

def get_similar_terms(query, top_k=5):

query_embedding=embedding_model.encode([query])

similarities=cosine_similarity(query_embedding, corpus_embeddings)[0]

top_indices=[Link]()[-top_k:][::-1]

return [(corpus[i],similarities[i]) for i in top_indices]

original_prompt="Explain climate change"

similar_terms=get_similar_terms("climate change",top_k=5)

print("Top Similar Terms:")

for word, score in similar_terms:

print(f"{word} (Similarity: {score:.4f})")

similar_word_list=[word for word,score in similar_terms]

enriched_prompt=f"{original_prompt} Include discussion of" + ",".join(similar_word_list)+"."

print("\n Enriched Prompt: \n")

print(enriched_prompt)

generator=pipeline("text-generation", model="google/flan-t5-large", device=0)

original_response=generator(original_prompt, max_length=300)[0]["generated_text"]

enriched_response=generator(enriched_prompt, max_length=300)[0]["generated_text"]

print("\n______Original Response______\n")

print(original_response)

print("\n______Enriched Response______\n")

print(enriched_response)

print("\nWord Count Comparision:")

print("\nOriginal:",len(original_response.split()))

print("Enriched:",len(enriched_response.split()))
5. Use word embeddings to create meaningful sentences for creative tasks. Retrieve similar words for a seed word. Create a
sentence or story using these words as a starting point. Write a program that: Takes a seed word. Generates similar words.
Constructs a short paragraph using these words.

!pip install gensim

import [Link] as api

print("Loading model...")

model=[Link]("glove-wiki-gigaword-50")

seed_word=input("Enter a seed word:").lower()

if seed_word in model:

similar_words=model.most_similar(seed_word, topn=5)

print("\nSimilar Words:")

words_list=[]

for word,score in similar_words:

print(f"{word}(similarity: {score:.4f})")

words_list.append(word)

paragraph=(f"{seed_word.capitalize()} is connected with " + "," .join(words_list[:-1]) +f", and {words_list[-1]}." f"These elements
together define the essence of {seed_word}.")

print("\nGenerated Paragraph:")

print(paragraph)

else:

print("Seed word not found in the model.")

6. Use a pre-trained Hugging Face model to analyze sentiment in text. Assume a real-world application, Load the sentiment
analysis pipeline. Analyze the sentiment by giving sentences to input.

!pip install transformers

from transformers import pipeline

sentence_pipeline=pipeline("sentiment-analysis")

input_sentences=[

"The new phone I bought is absolutely amazing!",

"Worst customer service ever. I'm never coming back.",

"The experience was avaerage, nothing special.",

"Fast delivery and the packaging was perfect.",

"The product broke within two days. Very disappointed."

results = sentence_pipeline(input_sentences)

print("Sentiment Analysis Results:\n")

for sentence,result in zip(input_sentences,results):

print(f"Sentence: {sentence}")

print(f"Predicted Sentiment: {result['label']}, Confidence Score: {result['score']:.2f}\n")

7. Summarize long texts using a pre-trained summarization model using Hugging face model. Load the summarization pipeline.
Take a passage as input and obtain the summarized text.

!pip install transformers sentencepiece -q

from transformers import pipeline

summarizer = pipeline("text-generation", model="t5-small")

text = """

The Industrial Revolution changed societies from farming-based to industrial economies.

Factories, machines and steam engines increased production and improved transportation.

"""

summary = summarizer(

"summarize: " + text,

max_length=60,

min_length=30,

do_sample=False

print(summary[0]['generated_text'])

Gen Ai Lab Manual
No ratings yet
Gen Ai Lab Manual
16 pages
Exploring Word Relationships with Gensim
No ratings yet
Exploring Word Relationships with Gensim
15 pages
GEN AI Lab Manual
No ratings yet
GEN AI Lab Manual
16 pages
Generative AI Lab Manual for CSE
No ratings yet
Generative AI Lab Manual for CSE
24 pages
Word Embedding and Similarity Analysis
No ratings yet
Word Embedding and Similarity Analysis
12 pages
Word Embedding Analysis and Visualization
No ratings yet
Word Embedding Analysis and Visualization
8 pages
Gensim Word Vector Analysis Labs
No ratings yet
Gensim Word Vector Analysis Labs
8 pages
Gensim Word Embeddings and Visualization
No ratings yet
Gensim Word Embeddings and Visualization
8 pages
Word Embeddings with Gensim and PCA
No ratings yet
Word Embeddings with Gensim and PCA
18 pages
GloVe and Word2Vec Usage Guide
No ratings yet
GloVe and Word2Vec Usage Guide
12 pages
Gensim NLP Model and Word Analysis
No ratings yet
Gensim NLP Model and Word Analysis
5 pages
Generative AI Lab Manual for CSE
No ratings yet
Generative AI Lab Manual for CSE
24 pages
Enhancing GenAI Prompts with Word Embeddings
No ratings yet
Enhancing GenAI Prompts with Word Embeddings
16 pages
Program Ms
No ratings yet
Program Ms
9 pages
Word Embedding Techniques in Python
No ratings yet
Word Embedding Techniques in Python
6 pages
Gen AI Lab Manual
No ratings yet
Gen AI Lab Manual
12 pages
Generative AI Lab Manual Overview
No ratings yet
Generative AI Lab Manual Overview
16 pages
Gensim NLP Handbook Overview
No ratings yet
Gensim NLP Handbook Overview
16 pages
Gen Ai Manual
No ratings yet
Gen Ai Manual
27 pages
Word Vector Analysis and Visualization
No ratings yet
Word Vector Analysis and Visualization
21 pages
Generative AI - Manual
No ratings yet
Generative AI - Manual
23 pages
Generative AI Manual
No ratings yet
Generative AI Manual
22 pages
Gen AI
No ratings yet
Gen AI
1 page
Gen AI Lab Manual
No ratings yet
Gen AI Lab Manual
17 pages
AI-Enhanced Word Vector Techniques
No ratings yet
AI-Enhanced Word Vector Techniques
27 pages
Gena PLT: Word Vector Analysis
No ratings yet
Gena PLT: Word Vector Analysis
6 pages
Gen Ai Lab Manual Programs
No ratings yet
Gen Ai Lab Manual Programs
28 pages
Word2Vec Implementation in Python
No ratings yet
Word2Vec Implementation in Python
3 pages
RAG Techniques for Document Analysis
No ratings yet
RAG Techniques for Document Analysis
5 pages
Using Word2Vec for Sentiment Analysis
No ratings yet
Using Word2Vec for Sentiment Analysis
18 pages
Gen Ai Lab Manual
No ratings yet
Gen Ai Lab Manual
9 pages
GenAI Lab 2
No ratings yet
GenAI Lab 2
19 pages
Generative Ai 1
No ratings yet
Generative Ai 1
14 pages
Explore Word Relationships with Gensim
No ratings yet
Explore Word Relationships with Gensim
17 pages
163 - NLP - M3 - Assignment 3
No ratings yet
163 - NLP - M3 - Assignment 3
11 pages
Python Foundations for Generative AI
No ratings yet
Python Foundations for Generative AI
67 pages
GenAI Lab Mannual
No ratings yet
GenAI Lab Mannual
36 pages
Generative AI Lab Manual
No ratings yet
Generative AI Lab Manual
17 pages
AI Text Processing with Transformers
No ratings yet
AI Text Processing with Transformers
7 pages
Enhancing AI Prompts with Word Embeddings
No ratings yet
Enhancing AI Prompts with Word Embeddings
6 pages
Gen AI Lab Manual
No ratings yet
Gen AI Lab Manual
26 pages
Lab 4 GENAI
No ratings yet
Lab 4 GENAI
2 pages
SVM Applications in NLP Lab Manual
No ratings yet
SVM Applications in NLP Lab Manual
21 pages
Gen Ai Lab Manual - Sjmit
No ratings yet
Gen Ai Lab Manual - Sjmit
26 pages
Hands-On Guide to Large Language Models
100% (1)
Hands-On Guide to Large Language Models
59 pages
Word2Vec and Visualization Techniques
No ratings yet
Word2Vec and Visualization Techniques
1 page
RAG System Setup and Usage Guide
No ratings yet
RAG System Setup and Usage Guide
8 pages
AI Text Generation and NLP Tools Guide
No ratings yet
AI Text Generation and NLP Tools Guide
2 pages
Word Vector Analysis and Visualization
No ratings yet
Word Vector Analysis and Visualization
5 pages
Generative AI Lab Manual (BAIL657C)
No ratings yet
Generative AI Lab Manual (BAIL657C)
34 pages
Sentiment Analysis with Hugging Face
No ratings yet
Sentiment Analysis with Hugging Face
6 pages
Fine-Tuned Vs RAG Short Notes ?
No ratings yet
Fine-Tuned Vs RAG Short Notes ?
25 pages
Nlpassignment 2
No ratings yet
Nlpassignment 2
12 pages
NLP Sentiment Analysis Pipeline Guide
No ratings yet
NLP Sentiment Analysis Pipeline Guide
8 pages
Gen AI Lab Questions
No ratings yet
Gen AI Lab Questions
1 page
Business Growth Advisor with GPT-2
No ratings yet
Business Growth Advisor with GPT-2
12 pages
Agentic AI Lab V2
No ratings yet
Agentic AI Lab V2
11 pages
CLN 708: Machine Learning For Computational Linguistics (Lecture 4)
No ratings yet
CLN 708: Machine Learning For Computational Linguistics (Lecture 4)
34 pages
GenAI 7 To 10
No ratings yet
GenAI 7 To 10
13 pages
Capacity Planning IT Assessment Questions
No ratings yet
Capacity Planning IT Assessment Questions
2 pages
Database Management System Lab Manual
No ratings yet
Database Management System Lab Manual
61 pages
Bioengineering for Muscular Dystrophy & Osteoporosis
No ratings yet
Bioengineering for Muscular Dystrophy & Osteoporosis
49 pages
Trends in Bioengineering Techniques
No ratings yet
Trends in Bioengineering Techniques
11 pages
Avnet Xilinx Product Selection Guide 2021 EN PDF
No ratings yet
Avnet Xilinx Product Selection Guide 2021 EN PDF
68 pages
Malcom PCU-200 Viscometer Manual
No ratings yet
Malcom PCU-200 Viscometer Manual
36 pages
B. Tech Mechanical Engineering Syllabus
No ratings yet
B. Tech Mechanical Engineering Syllabus
53 pages
Spectrophotometry and Colorimetry Overview
No ratings yet
Spectrophotometry and Colorimetry Overview
43 pages
Rock Quality Designation (RQD) Analysis
No ratings yet
Rock Quality Designation (RQD) Analysis
9 pages
Plosives and Fricatives Explained
No ratings yet
Plosives and Fricatives Explained
16 pages
Set Theory and Binary Relations
No ratings yet
Set Theory and Binary Relations
28 pages
Natural Convection in Domestic Refrigerators
No ratings yet
Natural Convection in Domestic Refrigerators
10 pages
12-Port X-Pol Antenna Datasheet
No ratings yet
12-Port X-Pol Antenna Datasheet
6 pages
Mineral Classification and Identification
No ratings yet
Mineral Classification and Identification
3 pages
ABAP Class Definition for Stock Management
No ratings yet
ABAP Class Definition for Stock Management
22 pages
Sampling Plans for Meter Inspection
No ratings yet
Sampling Plans for Meter Inspection
13 pages
Food Process Engineering and Technology 1St Edition Zeki Berk
No ratings yet
Food Process Engineering and Technology 1St Edition Zeki Berk
86 pages
DTH-29U7 Service Manual Overview
No ratings yet
DTH-29U7 Service Manual Overview
98 pages
Biology Practice Questions and Answers
No ratings yet
Biology Practice Questions and Answers
5 pages
Java Object-Oriented Concepts Exam 2023
No ratings yet
Java Object-Oriented Concepts Exam 2023
2 pages
NSE6_FWB-6.0 Exam Dumps & Questions
No ratings yet
NSE6_FWB-6.0 Exam Dumps & Questions
4 pages
WinPCIN Data Transfer Guide
No ratings yet
WinPCIN Data Transfer Guide
4 pages
Standard U-Bolt Specifications and Ratings
100% (1)
Standard U-Bolt Specifications and Ratings
2 pages
Life Contingencies II: Continuous Annuities
No ratings yet
Life Contingencies II: Continuous Annuities
16 pages
Minimum Diameter for Overhang Beam Support
No ratings yet
Minimum Diameter for Overhang Beam Support
58 pages
PDS New
No ratings yet
PDS New
3 pages
Generator Merk Marelli
100% (3)
Generator Merk Marelli
118 pages
Advanced Mathematics Exam Paper 2013
No ratings yet
Advanced Mathematics Exam Paper 2013
4 pages
Milky Way Warp Dynamics and Kinematics
No ratings yet
Milky Way Warp Dynamics and Kinematics
13 pages
FINRA Testbank: 984 Questions & Resources
No ratings yet
FINRA Testbank: 984 Questions & Resources
5 pages
WingX User Manual Version26 1
No ratings yet
WingX User Manual Version26 1
110 pages
426-5051-00 - Turck Breakout & BoxRemote Module
No ratings yet
426-5051-00 - Turck Breakout & BoxRemote Module
6 pages
Analog Circuit Fault Diagnosis Using WPA-GRNN
No ratings yet
Analog Circuit Fault Diagnosis Using WPA-GRNN
11 pages
Oil Well Cementing Techniques and Types
No ratings yet
Oil Well Cementing Techniques and Types
31 pages

Micro Genai

Uploaded by

Micro Genai

Uploaded by

1. Explore pre-trained word vectors. Explore word relationships using vector arithmetic.

Perform arithmetic operations and

!pip install gensim

from [Link] import load

print("Loading pre-trained Glove model (50 Dimensions)___")

print("\n king-man+woman=", result[0][0])

print("\n france-paris+italy=", result[0][0])

print("\n Top 5 words similar to 'programming':")

for word,similarity in result:

!pip install gensim matplotlib scikit-learn

import [Link] as api

import [Link] as plt

from [Link] import PCA

vectors=[model[word] for word in words]

for i,word in enumerate(words):

[Link](reduced_vectors[i][0]+0.01, reduced_vectors[i][1]+0.01, word)

[Link]("PCA Visualization of Technology Word Embeddings")

[Link]('PCA Compponent 1')

[Link]('PCA Component 2')

print("Top 5 similar words to 'programming':")

for word,score in Similar_words:

!pip install gensim

from [Link] import Word2Vec

"the doctors examined the patient",

"the patient was diagnosed with diabetes",

"the doctor prescribed medicine",

"nedicinal treatment improves patient health",

"the hospital provides medical care",

"nurses assist the doctor during treatment",

"the diagnosis helps in treatment planning"

tokenized_sentences=[[Link]() for sentence in Sentences]

print("\n Words similar to 'doctor':")

for word,score in similar_words:

print("\n Words similar to 'treatment':")

for word,score in similar_words:

!pip install numpy sentence_transformers scikit-learn transformers

from sentence_transformers import SentenceTransformer

from [Link] import cosine_similarity

from transformers import pipeline

corpus=["global warming","greenhouse effect","carbon emissions","fossil fuels","rising temperatures","extreme weather","sea-

def get_similar_terms(query, top_k=5):

return [(corpus[i],similarities[i]) for i in top_indices]

original_prompt="Explain climate change"

print("Top Similar Terms:")

for word, score in similar_terms:

print(f"{word} (Similarity: {score:.4f})")

similar_word_list=[word for word,score in similar_terms]

enriched_prompt=f"{original_prompt} Include discussion of" + ",".join(similar_word_list)+"."

print("\n Enriched Prompt: \n")

generator=pipeline("text-generation", model="google/flan-t5-large", device=0)

print("\nWord Count Comparision:")

!pip install gensim

import [Link] as api

seed_word=input("Enter a seed word:").lower()

for word,score in similar_words:

print("Seed word not found in the model.")

!pip install transformers

from transformers import pipeline

"The new phone I bought is absolutely amazing!",

"Worst customer service ever. I'm never coming back.",

"The experience was avaerage, nothing special.",

"Fast delivery and the packaging was perfect.",

"The product broke within two days. Very disappointed."

print("Sentiment Analysis Results:\n")

for sentence,result in zip(input_sentences,results):

print(f"Predicted Sentiment: {result['label']}, Confidence Score: {result['score']:.2f}\n")

!pip install transformers sentencepiece -q

from transformers import pipeline

summarizer = pipeline("text-generation", model="t5-small")

The Industrial Revolution changed societies from farming-based to industrial economies.

"summarize: " + text,

You might also like