`diart.blocks.diarization`#

Module Contents#

Classes#

`SpeakerDiarizationConfig`	Configuration containing the required
`SpeakerDiarization`	Represents a streaming audio pipeline

class diart.blocks.diarization.SpeakerDiarizationConfig(segmentation=None, embedding=None, duration=5, step=0.5, latency=None, tau_active=0.6, rho_update=0.3, delta_new=1, gamma=3, beta=10, max_speakers=20, normalize_embedding_weights=False, device=None, sample_rate=16000, **kwargs)#

Bases: diart.blocks.base.PipelineConfig

Configuration containing the required parameters to build and run a pipeline

Parameters:

segmentation (diart.models.SegmentationModel | None) –
embedding (diart.models.EmbeddingModel | None) –
duration (float) –
step (float) –
latency (float | typing_extensions.Literal[max, min] | None) –
tau_active (float) –
rho_update (float) –
delta_new (float) –
gamma (float) –
beta (float) –
max_speakers (int) –
normalize_embedding_weights (bool) –
device (torch.device | None) –
sample_rate (int) –

property duration: float#

The duration of an input audio chunk (in seconds)

Return type:: float

property step: float#

The step between two consecutive input audio chunks (in seconds)

Return type:: float

property latency: float#

The algorithmic latency of the pipeline (in seconds). At time t of the audio stream, the pipeline will output predictions for time t - latency.

Return type:: float

property sample_rate: int#

The sample rate of the input audio stream

Return type:: int

class diart.blocks.diarization.SpeakerDiarization(config=None)#

Bases: diart.blocks.base.Pipeline

Represents a streaming audio pipeline

Parameters:: config (SpeakerDiarizationConfig | None) –

property config: SpeakerDiarizationConfig#

Return type:: SpeakerDiarizationConfig

static get_config_class()#

Return type:: type

static suggest_metric()#

Return type:: pyannote.metrics.base.BaseMetric

static hyper_parameters()#

Return type:: Sequence[diart.blocks.base.HyperParameter]

set_timestamp_shift(shift)#

Parameters:: shift (float) –

reset()#

__call__(waveforms)#

Diarize the next audio chunks of an audio stream.

Parameters:: waveforms (Sequence[SlidingWindowFeature]) – A sequence of consecutive audio chunks from an audio stream.
Returns:: Speaker diarization of each chunk alongside their corresponding audio.
Return type:: Sequence[tuple[Annotation, SlidingWindowFeature]]

diart.blocks.diarization#

Module Contents#

Classes#

`diart.blocks.diarization`#