0% found this document useful (0 votes)

4 views4 pages

Emotion Dect

Uploaded by

pmeshika11

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views4 pages

Emotion Dect

Uploaded by

pmeshika11

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 4

import torch

import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms, models
from sklearn.metrics import accuracy_score, precision_recall_fscore_support
from transformers import BertTokenizer, BertModel
import torchaudio
import numpy as np

# Dataset Definition

class EmotionDataset(Dataset):
def __init__(self, image_files, text_data, audio_files, labels, tokenizer,
max_len=128):
self.image_files = image_files
self.text_data = text_data
self.audio_files = audio_files
self.labels = labels
self.tokenizer = tokenizer
self.max_len = max_len

self.image_transform = transforms.Compose([
transforms.Resize((224,224)),
transforms.ToTensor(),
transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])
])

def __len__(self):
return len(self.labels)

def getitem(self, idx):

# Image
image = self.image_transform(self.image_files[idx])

# Text
text_encoding = self.tokenizer(
self.text_data[idx],
max_length=self.max_len,
padding='max_length',
truncation=True,
return_tensors='pt'
)
input_ids = text_encoding['input_ids'].squeeze(0)
attention_mask = text_encoding['attention_mask'].squeeze(0)

# Audio
waveform, sample_rate = torchaudio.load(self.audio_files[idx])
waveform = torchaudio.transforms.Resample(orig_freq=sample_rate,
new_freq=16000)(waveform)
waveform = waveform.mean(dim=0, keepdim=True) # mono

label = torch.tensor(self.labels[idx], dtype=torch.long)

return image, input_ids, attention_mask, waveform, label

# Hybrid Gated Cross-Attention Model

class HGACrossAttentionModel(nn.Module):
def __init__(self, num_classes=7):
super(HGACrossAttentionModel, self).__init__()

# Image CNN (ResNet backbone)

resnet = models.resnet18(pretrained=True)
self.cnn = nn.Sequential(*list(resnet.children())[:-1])
self.img_fc = nn.Linear(resnet.fc.in_features, 256)

# Text BERT
self.bert = BertModel.from_pretrained('bert-base-uncased')
self.txt_fc = nn.Linear(self.bert.config.hidden_size, 256)

# Audio CNN
self.audio_conv = nn.Sequential(
nn.Conv1d(1,16, kernel_size=3, stride=1, padding=1),
nn.ReLU(),
nn.Conv1d(16,32, kernel_size=3, stride=1, padding=1),
nn.ReLU(),
nn.AdaptiveAvgPool1d(1)
)
self.audio_fc = nn.Linear(32, 256)

# Gated Cross-Attention
self.gate_img = nn.Linear(256, 256)
self.gate_txt = nn.Linear(256, 256)
self.gate_audio = nn.Linear(256, 256)

self.classifier = nn.Sequential(
nn.Linear(256*3, 128),
nn.ReLU(),
nn.Linear(128, num_classes)
)

def forward(self, image, input_ids, attention_mask, audio):

# Image
img_feat = self.cnn(image).squeeze(-1).squeeze(-1)
img_feat = F.relu(self.img_fc(img_feat))

# Text
txt_out = self.bert(input_ids=input_ids, attention_mask=attention_mask)
txt_feat = F.relu(self.txt_fc(txt_out.pooler_output))

# Audio
audio_feat = self.audio_conv(audio)
audio_feat = audio_feat.squeeze(-1)
audio_feat = F.relu(self.audio_fc(audio_feat))

# Gated Cross Attention

gate_img = torch.sigmoid(self.gate_img(img_feat))
gate_txt = torch.sigmoid(self.gate_txt(txt_feat))
gate_audio = torch.sigmoid(self.gate_audio(audio_feat))

fused = torch.cat([
img_feat * gate_img,
txt_feat * gate_txt,
audio_feat * gate_audio
], dim=1)

out = self.classifier(fused)
return out

# Training & Evaluation

def train_model(model, dataloader, criterion, optimizer, device):

model.train()
total_loss = 0
for image, input_ids, attention_mask, audio, labels in dataloader:
image, input_ids, attention_mask, audio, labels = image.to(device),
input_ids.to(device), attention_mask.to(device), audio.to(device),
labels.to(device)
optimizer.zero_grad()
outputs = model(image, input_ids, attention_mask, audio)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
total_loss += loss.item()
return total_loss / len(dataloader)

def evaluate_model(model, dataloader, device):

model.eval()
all_preds, all_labels = [], []
with torch.no_grad():
for image, input_ids, attention_mask, audio, labels in dataloader:
image, input_ids, attention_mask, audio = image.to(device),
input_ids.to(device), attention_mask.to(device), audio.to(device)
outputs = model(image, input_ids, attention_mask, audio)
preds = torch.argmax(outputs, dim=1).cpu().numpy()
all_preds.extend(preds)
all_labels.extend(labels.numpy())

acc = accuracy_score(all_labels, all_preds)

precision, recall, f1, _ = precision_recall_fscore_support(all_labels,
all_preds, average='weighted')
return acc, precision, recall, f1

# Usage Expalined

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
dataset = EmotionDataset(image_files, text_data, audio_files, labels, tokenizer)
dataloader = DataLoader(dataset, batch_size=16, shuffle=True)

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

model = HGACrossAttentionModel(num_classes=7).to(device)
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)

for epoch in range(10):

train_loss = train_model(model, dataloader, criterion, optimizer, device)
acc, precision, recall, f1 = evaluate_model(model, dataloader, device)
print(f"Epoch {epoch+1}: Loss={train_loss:.10f}, Acc={acc:.10f},
Precision={precision:.10f}, Recall={recall:.10f},
F1={f1:.10f}")

tensor([2, 1, 3, 0])
["Sad", "Happy", "Neutral", "Angry"]

# Simple HGM-XA Multimodal Emotion
No ratings yet
# Simple HGM-XA Multimodal Emotion
3 pages
Transformers Torch
No ratings yet
Transformers Torch
38 pages
Speech
No ratings yet
Speech
13 pages
ATI Ipynb
No ratings yet
ATI Ipynb
12 pages
Ass
No ratings yet
Ass
5 pages
Deep Learning Lab Manual With Code
No ratings yet
Deep Learning Lab Manual With Code
10 pages
Ass 8
No ratings yet
Ass 8
2 pages
Audio Recognition with CNN
No ratings yet
Audio Recognition with CNN
14 pages
Applied Machine and Deep Learning
No ratings yet
Applied Machine and Deep Learning
34 pages
Project Source
No ratings yet
Project Source
21 pages
Bert
No ratings yet
Bert
2 pages
Position Encoding: Intuition Lack Inherent Word Order Awareness
No ratings yet
Position Encoding: Intuition Lack Inherent Word Order Awareness
33 pages
Assignment 9
No ratings yet
Assignment 9
4 pages
Code File
No ratings yet
Code File
6 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
EncoderDecoderSeq2Seq DeepLSTM
100% (1)
EncoderDecoderSeq2Seq DeepLSTM
7 pages
Video Api Endpoint N
No ratings yet
Video Api Endpoint N
7 pages
GPT2 From Scratch in PyTorch
No ratings yet
GPT2 From Scratch in PyTorch
13 pages
Set A
No ratings yet
Set A
20 pages
Model
No ratings yet
Model
3 pages
Tutorial Pytorch Best Commands
No ratings yet
Tutorial Pytorch Best Commands
8 pages
Assign PDF
No ratings yet
Assign PDF
19 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
Report For Project Vehicle Position
No ratings yet
Report For Project Vehicle Position
6 pages
Video Api Endpoint
No ratings yet
Video Api Endpoint
2 pages
Font Image Augmentation & Model Training
No ratings yet
Font Image Augmentation & Model Training
78 pages
NLP 4
No ratings yet
NLP 4
10 pages
Practical 1
No ratings yet
Practical 1
6 pages
0.0.1 Implementation of Recurrent Neural Network: #Importing The Required Libraries
No ratings yet
0.0.1 Implementation of Recurrent Neural Network: #Importing The Required Libraries
9 pages
Neural Networks Lab Guide
No ratings yet
Neural Networks Lab Guide
26 pages
Vit32 GPTMD
No ratings yet
Vit32 GPTMD
6 pages
Code
No ratings yet
Code
4 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
HW3 Pedro Aguiar
No ratings yet
HW3 Pedro Aguiar
9 pages
Tensorflow Ensai SID 13 01 17
No ratings yet
Tensorflow Ensai SID 13 01 17
99 pages
Quality Testing MobileNet V2 Compressed
No ratings yet
Quality Testing MobileNet V2 Compressed
13 pages
Video 7 - Building A Multilayer Feedforward Network For Classification in PyTorch
No ratings yet
Video 7 - Building A Multilayer Feedforward Network For Classification in PyTorch
18 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
TensorFlow Crash Course: Linear Regression & Neural Networks
No ratings yet
TensorFlow Crash Course: Linear Regression & Neural Networks
63 pages
Lab 9
No ratings yet
Lab 9
29 pages
Tensorflow and Deep Learning
No ratings yet
Tensorflow and Deep Learning
51 pages
Experiment No 13 Final
No ratings yet
Experiment No 13 Final
9 pages
Writing Code For NLP Research-1
No ratings yet
Writing Code For NLP Research-1
254 pages
Keras
No ratings yet
Keras
4 pages
Guide To YAMNet - Sound Event Classifier
No ratings yet
Guide To YAMNet - Sound Event Classifier
10 pages
Exp. No.: I. Aim: AIML634P Neural Network Lab 2262034
No ratings yet
Exp. No.: I. Aim: AIML634P Neural Network Lab 2262034
6 pages
Codefp 1
No ratings yet
Codefp 1
15 pages
Face - Emotion Recog - Implementation
No ratings yet
Face - Emotion Recog - Implementation
11 pages
Train Py
No ratings yet
Train Py
4 pages
Wa0000.
No ratings yet
Wa0000.
40 pages
LLM Code Ref
No ratings yet
LLM Code Ref
10 pages
Report
No ratings yet
Report
13 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
Final Code
No ratings yet
Final Code
16 pages
NPU MachineLearning
No ratings yet
NPU MachineLearning
28 pages
AI by Hand Vol 1
No ratings yet
AI by Hand Vol 1
28 pages
Transformers Implementations 1731410319
No ratings yet
Transformers Implementations 1731410319
10 pages
Bemorail
No ratings yet
Bemorail
19 pages
Advances in Shannon Sampling Theory: Review Paper
No ratings yet
Advances in Shannon Sampling Theory: Review Paper
5 pages
Proceedings of International Congress of Mathematicians
100% (1)
Proceedings of International Congress of Mathematicians
829 pages
Percakapan Epp 1
No ratings yet
Percakapan Epp 1
4 pages
Holiday Home Work Class Vii All
No ratings yet
Holiday Home Work Class Vii All
28 pages
Chindia's Global Economic Impact
No ratings yet
Chindia's Global Economic Impact
10 pages
Project An Mid Test 3 Tasis
No ratings yet
Project An Mid Test 3 Tasis
1 page
ADM - SEC SAP - PDF Catalogue
No ratings yet
ADM - SEC SAP - PDF Catalogue
15 pages
CBSE Sample Paper Class 9 Science Set 4
100% (1)
CBSE Sample Paper Class 9 Science Set 4
7 pages
Yuma County Storm Drainage Manual FC - PWSIII
100% (1)
Yuma County Storm Drainage Manual FC - PWSIII
66 pages
DIY Laser Listening Circuit
100% (2)
DIY Laser Listening Circuit
2 pages
BPhO A2 Challenge 2016
No ratings yet
BPhO A2 Challenge 2016
8 pages
Biology: Exploring Life
No ratings yet
Biology: Exploring Life
35 pages
Grasshopper
No ratings yet
Grasshopper
111 pages
Rizal Library: (Ateneo de Manila University)
No ratings yet
Rizal Library: (Ateneo de Manila University)
13 pages
Welfare Economics
No ratings yet
Welfare Economics
6 pages
Why The Future Doesn - T Need Us - BILL JOY
No ratings yet
Why The Future Doesn - T Need Us - BILL JOY
18 pages
DIGITAL ENERGY MEDICINE: A Revolitonary New Form of Energy Medicine For The Digital Age
100% (20)
DIGITAL ENERGY MEDICINE: A Revolitonary New Form of Energy Medicine For The Digital Age
29 pages
A Student Teaching Portfolio 1
No ratings yet
A Student Teaching Portfolio 1
10 pages
In Memoriam Amin Sweeney
No ratings yet
In Memoriam Amin Sweeney
3 pages
Man in Space: The Brief History of Space Discovery
No ratings yet
Man in Space: The Brief History of Space Discovery
23 pages
Chaotic Equations in Cryptography
No ratings yet
Chaotic Equations in Cryptography
6 pages
TMS Journal Vol 36 No 1 PDF
No ratings yet
TMS Journal Vol 36 No 1 PDF
76 pages
Math Puzzles
No ratings yet
Math Puzzles
8 pages
Date Sheet of First Examination For Classes - 6 To 12 - 2025-2026
No ratings yet
Date Sheet of First Examination For Classes - 6 To 12 - 2025-2026
1 page
Earth Energies & Spirit Release
100% (4)
Earth Energies & Spirit Release
6 pages
Leaders at All Levels Prepare Themselves Their Teams and Organizations For The Future 56698916
100% (1)
Leaders at All Levels Prepare Themselves Their Teams and Organizations For The Future 56698916
124 pages
Excel VBA Made Easy-Liew Voon Kiong
100% (3)
Excel VBA Made Easy-Liew Voon Kiong
93 pages
Fleet Optimization for Energy Sector
No ratings yet
Fleet Optimization for Energy Sector
2 pages
Format For Thesis Project Report
No ratings yet
Format For Thesis Project Report
2 pages

Emotion Dect

Uploaded by

Emotion Dect

Uploaded by

import torch

def __getitem__(self, idx):

label = torch.tensor(self.labels[idx], dtype=torch.long)

# Hybrid Gated Cross-Attention Model

# Image CNN (ResNet backbone)

def forward(self, image, input_ids, attention_mask, audio):

# Gated Cross Attention

# Training & Evaluation

def train_model(model, dataloader, criterion, optimizer, device):

def evaluate_model(model, dataloader, device):

acc = accuracy_score(all_labels, all_preds)

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

for epoch in range(10):

You might also like

def getitem(self, idx):