Source code for mmlspark.cognitive.SpeechToTextSDK

# Copyright (C) Microsoft Corporation. All rights reserved.
# Licensed under the MIT License. See LICENSE in project root for information.


import sys
if sys.version >= '3':
    basestring = str

from pyspark import SparkContext, SQLContext
from pyspark.sql import DataFrame
from pyspark.ml.param.shared import *
from pyspark import keyword_only
from pyspark.ml.util import JavaMLReadable, JavaMLWritable
from mmlspark.core.serialize.java_params_patch import *
from pyspark.ml.wrapper import JavaTransformer, JavaEstimator, JavaModel
from pyspark.ml.common import inherit_doc
from mmlspark.core.schema.Utils import *

[docs]@inherit_doc
class SpeechToTextSDK(ComplexParamsMixin, JavaMLReadable, JavaMLWritable, JavaTransformer):
    """


    Args:

        audioDataCol (str): Column holding audio data, must be either ByteArrays or Strings representing file URIs
        endpointId (str): endpoint for custom speech models
        extraFfmpegArgs (list): extra arguments to for ffmpeg output decoding (default: [Ljava.lang.String;@39f2131)
        fileType (object): The file type of the sound files, supported types: wav, ogg, mp3
        format (object): Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))
        language (object): Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))
        outputCol (str): The name of the output column
        profanity (object): Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))
        recordAudioData (bool): Whether to record audio data to a file location, for use only with m3u8 streams (default: false)
        recordedFileNameCol (str): Column holding file names to write audio data to if ``recordAudioData'' is set to true
        streamIntermediateResults (bool): Whether or not to immediately return itermediate results, or group in a sequence (default: true)
        subscriptionKey (object): the API key to use
        url (str): Url of the service
    """

    @keyword_only
    def __init__(self, audioDataCol=None, endpointId=None, extraFfmpegArgs=[], fileType=None, format=None, language=None, outputCol=None, profanity=None, recordAudioData=False, recordedFileNameCol=None, streamIntermediateResults=True, subscriptionKey=None, url=None):
        super(SpeechToTextSDK, self).__init__()
        self._java_obj = self._new_java_obj("com.microsoft.ml.spark.cognitive.SpeechToTextSDK")
        self.audioDataCol = Param(self, "audioDataCol", "audioDataCol: Column holding audio data, must be either ByteArrays or Strings representing file URIs")
        self.endpointId = Param(self, "endpointId", "endpointId: endpoint for custom speech models")
        self.extraFfmpegArgs = Param(self, "extraFfmpegArgs", "extraFfmpegArgs: extra arguments to for ffmpeg output decoding (default: [Ljava.lang.String;@39f2131)")
        self._setDefault(extraFfmpegArgs=[])
        self.fileType = Param(self, "fileType", "fileType: The file type of the sound files, supported types: wav, ogg, mp3")
        self.format = Param(self, "format", "format:  Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))")
        self.language = Param(self, "language", "language:  Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))")
        self.outputCol = Param(self, "outputCol", "outputCol: The name of the output column")
        self.profanity = Param(self, "profanity", "profanity:  Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))")
        self.recordAudioData = Param(self, "recordAudioData", "recordAudioData: Whether to record audio data to a file location, for use only with m3u8 streams (default: false)")
        self._setDefault(recordAudioData=False)
        self.recordedFileNameCol = Param(self, "recordedFileNameCol", "recordedFileNameCol: Column holding file names to write audio data to if ``recordAudioData'' is set to true")
        self.streamIntermediateResults = Param(self, "streamIntermediateResults", "streamIntermediateResults: Whether or not to immediately return itermediate results, or group in a sequence (default: true)")
        self._setDefault(streamIntermediateResults=True)
        self.subscriptionKey = Param(self, "subscriptionKey", "subscriptionKey: the API key to use")
        self.url = Param(self, "url", "url: Url of the service")
        if hasattr(self, "_input_kwargs"):
            kwargs = self._input_kwargs
        else:
            kwargs = self.__init__._input_kwargs
        self.setParams(**kwargs)

[docs]    @keyword_only
    def setParams(self, audioDataCol=None, endpointId=None, extraFfmpegArgs=[], fileType=None, format=None, language=None, outputCol=None, profanity=None, recordAudioData=False, recordedFileNameCol=None, streamIntermediateResults=True, subscriptionKey=None, url=None):
        """
        Set the (keyword only) parameters

        Args:

            audioDataCol (str): Column holding audio data, must be either ByteArrays or Strings representing file URIs
            endpointId (str): endpoint for custom speech models
            extraFfmpegArgs (list): extra arguments to for ffmpeg output decoding (default: [Ljava.lang.String;@39f2131)
            fileType (object): The file type of the sound files, supported types: wav, ogg, mp3
            format (object): Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))
            language (object): Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))
            outputCol (str): The name of the output column
            profanity (object): Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))
            recordAudioData (bool): Whether to record audio data to a file location, for use only with m3u8 streams (default: false)
            recordedFileNameCol (str): Column holding file names to write audio data to if ``recordAudioData'' is set to true
            streamIntermediateResults (bool): Whether or not to immediately return itermediate results, or group in a sequence (default: true)
            subscriptionKey (object): the API key to use
            url (str): Url of the service
        """
        if hasattr(self, "_input_kwargs"):
            kwargs = self._input_kwargs
        else:
            kwargs = self.__init__._input_kwargs
        return self._set(**kwargs)

[docs]    def getAudioDataCol(self):
        """

        Returns:

            str: Column holding audio data, must be either ByteArrays or Strings representing file URIs
        """
        return self.getOrDefault(self.audioDataCol)


[docs]    def getEndpointId(self):
        """

        Returns:

            str: endpoint for custom speech models
        """
        return self.getOrDefault(self.endpointId)


[docs]    def getExtraFfmpegArgs(self):
        """

        Returns:

            list: extra arguments to for ffmpeg output decoding (default: [Ljava.lang.String;@39f2131)
        """
        return self.getOrDefault(self.extraFfmpegArgs)


[docs]    def getFileType(self):
        """

        Returns:

            object: The file type of the sound files, supported types: wav, ogg, mp3
        """
        return self._cache.get("fileType", None)


[docs]    def getFormat(self):
        """

        Returns:

            object: Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))
        """
        return self._cache.get("format", None)


[docs]    def getLanguage(self):
        """

        Returns:

            object: Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))
        """
        return self._cache.get("language", None)


[docs]    def getOutputCol(self):
        """

        Returns:

            str: The name of the output column
        """
        return self.getOrDefault(self.outputCol)


[docs]    def getProfanity(self):
        """

        Returns:

            object: Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))
        """
        return self._cache.get("profanity", None)


[docs]    def getRecordAudioData(self):
        """

        Returns:

            bool: Whether to record audio data to a file location, for use only with m3u8 streams (default: false)
        """
        return self.getOrDefault(self.recordAudioData)


[docs]    def getRecordedFileNameCol(self):
        """

        Returns:

            str: Column holding file names to write audio data to if ``recordAudioData'' is set to true
        """
        return self.getOrDefault(self.recordedFileNameCol)


[docs]    def getStreamIntermediateResults(self):
        """

        Returns:

            bool: Whether or not to immediately return itermediate results, or group in a sequence (default: true)
        """
        return self.getOrDefault(self.streamIntermediateResults)


[docs]    def getSubscriptionKey(self):
        """

        Returns:

            object: the API key to use
        """
        return self._cache.get("subscriptionKey", None)


[docs]    def getUrl(self):
        """

        Returns:

            str: Url of the service
        """
        return self.getOrDefault(self.url)


[docs]    def setAudioDataCol(self, value):
        """

        Args:

            audioDataCol: Column holding audio data, must be either ByteArrays or Strings representing file URIs

        """
        self._set(audioDataCol=value)
        return self


[docs]    def setEndpointId(self, value):
        """

        Args:

            endpointId: endpoint for custom speech models

        """
        self._set(endpointId=value)
        return self


[docs]    def setExtraFfmpegArgs(self, value):
        """

        Args:

            extraFfmpegArgs: extra arguments to for ffmpeg output decoding (default: [Ljava.lang.String;@39f2131)

        """
        self._set(extraFfmpegArgs=value)
        return self


[docs]    def setFileType(self, value):
        """

        Args:

            fileType: The file type of the sound files, supported types: wav, ogg, mp3

        """
        self._java_obj = self._java_obj.setFileType(value)
        return self


[docs]    def setFileTypeCol(self, value):
        """

        Args:

            fileType: The file type of the sound files, supported types: wav, ogg, mp3

        """
        self._java_obj = self._java_obj.setFileTypeCol(value)
        return self




[docs]    def setFormat(self, value):
        """

        Args:

            format:  Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))

        """
        self._java_obj = self._java_obj.setFormat(value)
        return self


[docs]    def setFormatCol(self, value):
        """

        Args:

            format:  Specifies the result format. Accepted values are simple and detailed. Default is simple.      (default: ServiceParamData(None,Some(Simple)))

        """
        self._java_obj = self._java_obj.setFormatCol(value)
        return self




[docs]    def setLanguage(self, value):
        """

        Args:

            language:  Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))

        """
        self._java_obj = self._java_obj.setLanguage(value)
        return self


[docs]    def setLanguageCol(self, value):
        """

        Args:

            language:  Identifies the spoken language that is being recognized.      (default: ServiceParamData(None,Some(en-us)))

        """
        self._java_obj = self._java_obj.setLanguageCol(value)
        return self




[docs]    def setOutputCol(self, value):
        """

        Args:

            outputCol: The name of the output column

        """
        self._set(outputCol=value)
        return self


[docs]    def setProfanity(self, value):
        """

        Args:

            profanity:  Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))

        """
        self._java_obj = self._java_obj.setProfanity(value)
        return self


[docs]    def setProfanityCol(self, value):
        """

        Args:

            profanity:  Specifies how to handle profanity in recognition results. Accepted values are masked, which replaces profanity with asterisks, removed, which remove all profanity from the result, or raw, which includes the profanity in the result. The default setting is masked.      (default: ServiceParamData(None,Some(Masked)))

        """
        self._java_obj = self._java_obj.setProfanityCol(value)
        return self




[docs]    def setRecordAudioData(self, value):
        """

        Args:

            recordAudioData: Whether to record audio data to a file location, for use only with m3u8 streams (default: false)

        """
        self._set(recordAudioData=value)
        return self


[docs]    def setRecordedFileNameCol(self, value):
        """

        Args:

            recordedFileNameCol: Column holding file names to write audio data to if ``recordAudioData'' is set to true

        """
        self._set(recordedFileNameCol=value)
        return self


[docs]    def setStreamIntermediateResults(self, value):
        """

        Args:

            streamIntermediateResults: Whether or not to immediately return itermediate results, or group in a sequence (default: true)

        """
        self._set(streamIntermediateResults=value)
        return self


[docs]    def setSubscriptionKey(self, value):
        """

        Args:

            subscriptionKey: the API key to use

        """
        self._java_obj = self._java_obj.setSubscriptionKey(value)
        return self


[docs]    def setSubscriptionKeyCol(self, value):
        """

        Args:

            subscriptionKey: the API key to use

        """
        self._java_obj = self._java_obj.setSubscriptionKeyCol(value)
        return self




[docs]    def setUrl(self, value):
        """

        Args:

            url: Url of the service

        """
        self._set(url=value)
        return self




[docs]    def setLocation(self, value):
        self._java_obj = self._java_obj.setLocation(value)
        return self


[docs]    @classmethod
    def read(cls):
        """ Returns an MLReader instance for this class. """
        return JavaMMLReader(cls)

[docs]    @staticmethod
    def getJavaPackage():
        """ Returns package name String. """
        return "com.microsoft.ml.spark.cognitive.SpeechToTextSDK"

    @staticmethod
    def _from_java(java_stage):
        module_name=SpeechToTextSDK.__module__
        module_name=module_name.rsplit(".", 1)[0] + ".SpeechToTextSDK"
        return from_java(java_stage, module_name)