<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Hello, thanks for the reply, I'll take a look at the repository.<br><br>What I want now is a tool that I indicate the path of 2 subtitles in srt format, where the first is the subtitle in English and the second is a subtitle in another language and the tool finds the translation of each English sentence in the second subtitle.<br><br>I believe this tool does this, or do I still need some other tool?<br></div></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Em seg, 28 de jan de 2019 às 07:34, Tiedemann, Jörg <<a href="mailto:jorg.tiedemann@helsinki.fi">jorg.tiedemann@helsinki.fi</a>> escreveu:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">



<div style="overflow-wrap: break-word;">
<div><br>
</div>
<div>The subtitles come from <a href="https://www.opensubtitles.org" target="_blank">https://www.opensubtitles.org</a> and more about cleaning, converting and aligning them is published in various papers. Look at the references at <a href="http://opus.nlpl.eu" target="_blank">http://opus.nlpl.eu</a>.
 Our tools for aligning subtitle files are available here: <a href="https://github.com/Helsinki-NLP/subalign" target="_blank">https://github.com/Helsinki-NLP/subalign</a> In addition to this we use language identification, some heuristics and language models for further
 filtering and cleaning the data set. Further feedback for improving the data sets is very welcome.</div>
<div><br>
</div>
<div>
<div style="color:rgb(0,0,0);letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px">
<div style="color:rgb(0,0,0);letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px">
<div style="color:rgb(0,0,0);letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px">
<div style="overflow-wrap: break-word;">
Jörg</div>
<div style="overflow-wrap: break-word;">
<span><br>
</span></div>
<div style="overflow-wrap: break-word;">
<span>********************************************************************************************</span><br>
<span>Jörg Tiedemann</span></div>
<div style="overflow-wrap: break-word;">
<span>Language Technology<span class="gmail-m_5856586193956674714Apple-tab-span" style="white-space:pre-wrap">
</span></span><a href="https://blogs.helsinki.fi/language-technology/" target="_blank">https://blogs.helsinki.fi/language-technology/</a></div>
<div><span>University of Helsinki</span></div>
</div>
</div>
</div>
</div>
<br>
<div>
<blockquote type="cite">
<div>On 27 Jan 2019, at 16:01, Humberto Castelo Branco <<a href="mailto:hlcb91@gmail.com" target="_blank">hlcb91@gmail.com</a>> wrote:</div>
<br class="gmail-m_5856586193956674714Apple-interchange-newline">
<div>
<div dir="ltr">
<div dir="ltr">Hello, good morning, my name is Humberto, I found the nlpl site through Google, more specifically the opus, from there I found the OpenSubtitles 2018 link containing several files and downloaded some of them, you used some tool to read
 the subtitles and extract the corresponding texts between languages? If so, is this tool available publicly? Congratulations on your work, it's great, wonderful, perfect.<br>
</div>
</div>
</div>
</blockquote>
</div>
<br>
</div>

</blockquote></div>