Rómeó és Júlia

Vajon hogyan kerül elő a Rómeó és Júlia az it-tanfolyam.hu szakmai blogban témaként? Hiszen mégiscsak egy Shakespeare színműről/tragédiáról van szó. Vajon mit programozhatunk Java nyelven ehhez kötődően épp Valentin-napon? Mindjárt kiderül.

Tegyünk fel egy kérdést és próbáljunk rá válaszolni! Vajon ki szereti jobban a másikat? Rómeó vagy Júlia?

Induljunk el az adatforrásból, amihez alkalmazkodnunk kell. A színmű angol nyelven publikusan elérhető XML formátumban: The Tragedy of Romeo and Juliet. Az XML fájlok könnyen feldolgozhatók Java nyelven. Részletek a fájlból (görgethető):

<?xml version="1.0"?>

<LINE>Two households, both alike in dignity,</LINE>

<LINE>In fair Verona, where we lay our scene,</LINE>

<LINE>From ancient grudge break to new mutiny,</LINE>

<LINE>Where civil blood makes civil hands unclean.</LINE>

...

</SPEECH>

<SPEAKER>ROMEO</SPEAKER>

<LINE>Is the day so young?</LINE>

</SPEECH>

<SPEAKER>ROMEO</SPEAKER>

<LINE>Stay, fellow; I can read.</LINE>

<STAGEDIR>Reads</STAGEDIR>

<LINE>'Signior Martino and his wife and daughters;</LINE>

<LINE>County Anselme and his beauteous sisters; the lady</LINE>

...

<LINE>assembly: whither should they come?</LINE>

</SPEECH>

<SPEAKER>ROMEO</SPEAKER>

<LINE><STAGEDIR>To JULIET</STAGEDIR> If I profane with my unworthiest hand</LINE>

<LINE>This holy shrine, the gentle fine is this:</LINE>

<LINE>My lips, two blushing pilgrims, ready stand</LINE>

<LINE>To smooth that rough touch with a tender kiss.</LINE>

</SPEECH>

<STAGEDIR>Enter JULIET</STAGEDIR>

</ACT>

Az XML fájl felépítését tanulmányozva (1-5 alapján) megállapíthatóak az alábbiak:

A színmű öt felvonásból áll, ezeket <ACT></ACT> csomópontok jelölik.
Egy „adagnyi” beszédet a <SPEECH></SPEECH> csomópont fog össze.
A csomópontban található, hogy ki beszél: ez a <SPEAKER></SPEAKER> elem. A mesélő, kar esetén ez az elem üres, és a null-t nem szabad feldolgozni.
A csomópontban találhatók a szabadvers kimondott sorai: ezek a <LINE></LINE> elemek. Legalább egy sor minden beszédben van, és nem tudjuk előre a számukat.
Nem következetes helyen a DOM-ban, többféleképpen beágyazva és önállóan is előfordulhatnak <STAGEDIR></STAGEDIR> elemek. Ezek a színmű Kosztolányi-féle magyar fordításában dőlt betűvel megjelenő – cselekvésre utaló – színpadi utasítások. Van köztük csók is, amit az XML-ből nem szabad feldolgozni, bár erősen ráutaló magatartás. 🙂
Nem tudjuk előre, hogy hány csomópont található a fájlban.

A Java program készítése, tesztelése közben – mintegy mellékesen – megtudhatjuk, hogy Rómeó 612 sorban 24075 betűnyi, Júlia 544 sorban 21855 betűnyi szöveget mond. Persze nem mindet egymásnak mondják. Eközben vajon hányszor mondják ki a szeret, szeretem, szeretlek szavakat? A ragoktól, toldalékoktól, kis- és nagybetűket nem megkülönböztetve és attól is eltekintve, hogy éppen kinek/kiknek mondják amit éppen mondanak, egy becsléshez elegendő, ha a love szóra fókuszálunk (számíthatna a loving alak is).

Az alábbi Java forráskód betölti az XML fájlt a memóriába. Ezután kiválogatja a beszédeket. Ha a beszélő élő ember (szereplő), akkor érdekes, hogy mit/miket mond. Ha ROMEO vagy JULIET mondja az adott sort, akkor azt a program kiválogatja két generikus listába ( romeoLineList és julietLineList) beszédnyi adagokban. Ez nem szétválogatás programozási tétel, mert nem minden beszéd minden sora kerül valahová. A kivételkezelés nem kidolgozott.

private static ArrayList<String> getLineList(final Node SPEECH) {

ArrayList<String> lineList=new ArrayList<>();

NodeList nodeList=((Element)SPEECH).getElementsByTagName("LINE");

for(int i=0; i<nodeList.getLength(); i++) {

String line=

((Element)nodeList.item(i)).getFirstChild().getNodeValue();

lineList.add(line);

}

return lineList;

}

public static void main(String[] args) {

ArrayList<String> romeoLineList=new ArrayList<>();

ArrayList<String> julietLineList=new ArrayList<>();

try {

NodeList speechList=DocumentBuilderFactory.newInstance().

newDocumentBuilder().parse(new File("./files/r_and_j.xml")).

getDocumentElement().getElementsByTagName("SPEECH");

for(int i=0; i<speechList.getLength(); i++) {

Node speech=speechList.item(i);

Node speaker=((Element)speech).getElementsByTagName("SPEAKER").

item(0).getFirstChild();

if(speaker!=null)

switch(speaker.getNodeValue()) {

case "ROMEO":

romeoLineList.addAll(getLineList(speech));

break;

case "JULIET":

julietLineList.addAll(getLineList(speech));

}

catch(ParserConfigurationException | SAXException | IOException e) {

e.printStackTrace();

}

//...

}

Könnyen megkaphatjuk, hogy Rómeó hány darab olyan sort mond, amely tartalmazza a love szót. Például ennek a lambda kifejezésnek kiíratva az eredményét a konzolra:

romeoLineList.stream().

filter(f->f!=null).filter(f->f.toLowerCase().contains("love")).

count();

Könnyen megkaphatjuk Rómeótól a 53 sornyi szöveget is így:

romeoLineList.stream().

filter(f->f!=null).filter(f->f.toLowerCase().contains("love")).

forEach(line->System.out.println(line));

Íme Rómeó kiválogatott sorai (az 5. sorban kétszer is előfordul a love, de ez most nem számít):

Out of her favour, where I am in love.

Alas, that love, whose view is muffled still,

Here's much to do with hate, but more with love.

Why, then, O brawling love! O loving hate!

This love feel I, that feel no love in this.

Why, such is love's transgression.

With more of thine: this love that thou hast shown

Love is a smoke raised with the fume of sighs;

Being purged, a fire sparkling in lovers' eyes;

Being vex'd a sea nourish'd with lovers' tears:

In sadness, cousin, I do love a woman.

A right good mark-man! And she's fair I love.

From love's weak childish bow she lives unharm'd.

She hath forsworn to love, and in that vow

widow of Vitravio; Signior Placentio and his lovely

One fairer than my love! the all-seeing sun

Under love's heavy burden do I sink.

Is love a tender thing? it is too rough,

Did my heart love till now? forswear it, sight!

It is my lady, O, it is my love!

O, that I were a glove upon that hand,

Call me but love, and I'll be new baptized;

With love's light wings did I o'er-perch these walls;

For stony limits cannot hold love out,

And what love can do that dares love attempt;

And but thou love me, let them find me here:

Than death prorogued, wanting of thy love.

By love, who first did prompt me to inquire;

If my heart's dear love--

The exchange of thy love's faithful vow for mine.

Wouldst thou withdraw it? for what purpose, love?

Love goes toward love, as schoolboys from

But love from love, toward school with heavy looks.

How silver-sweet sound lovers' tongues by night,

Then plainly know my heart's dear love is set

And bad'st me bury love.

I pray thee, chide not; she whom I love now

Doth grace for grace and love for love allow;

A gentleman, nurse, that loves to hear himself talk,

Then love-devouring death do what he dare;

Tybalt, the reason that I have to love thee

But love thee better than thou canst devise,

Till thou shalt know the reason of my love:

Wert thou as young as I, Juliet thy love,

My conceal'd lady to our cancell'd love?

No nightingale: look, love, what envious streaks

That may convey my greetings, love, to thee.

And trust me, love, in my eye so do you:

Ah me! how sweet is love itself possess'd,

When but love's shadows are so rich in joy!

By heaven, I love thee better than myself;

Call this a lightning? O my love! my wife!

Here's to my love!

Hasonlóan megkaphatjuk Júlia 38 kiválogatott sorát is:

My only love sprung from my only hate!

Prodigious birth of love it is to me,

That I must love a loathed enemy.

Or, if thou wilt not, be but sworn my love,

Dost thou love me? I know thou wilt say 'Ay,'

Thou mayst prove false; at lovers' perjuries

If thou dost love, pronounce it faithfully:

My true love's passion: therefore pardon me,

And not impute this yielding to light love,

Lest that thy love prove likewise variable.

This bud of love, by summer's ripening breath,

My love as deep; the more I give to thee,

I hear some noise within; dear love, adieu!

If that thy bent of love be honourable,

Remembering how I love thy company.

O, she is lame! love's heralds should be thoughts,

Therefore do nimble-pinion'd doves draw love,

My words would bandy her to my sweet love,

Sweet, sweet, sweet nurse, tell me, what says my love?

'Your love says, like an honest gentleman,

But my true love is grown to such excess

Spread thy close curtain, love-performing night,

Lovers can see to do their amorous rites

By their own beauties; or, if love be blind,

With thy black mantle; till strange love, grown bold,

Think true love acted simple modesty.

That all the world will be in love with night

O, I have bought the mansion of a love,

My dear-loved cousin, and my dearer lord?

Believe me, love, it was the nightingale.

Art thou gone so? love, lord, ay, husband, friend!

To wreak the love I bore my cousin

But thankful even for hate, that is meant love.

I will confess to you that I love him.

To live an unstain'd wife to my sweet love.

Love give me strength! and strength shall help afford.

And gave him what becomed love I might,

What's here? a cup, closed in my true love's hand?

Próbáljunk válaszolni a fentiek alapján a feltett kérdésre! Következtethetünk arra, hogy Rómeó jobban szereti Júliát. Legalábbis többször említi. 53>38. Persze tudjuk, hogy mindez nem ilyen egyszerű. 🙂

A bejegyzéshez tartozó teljes forráskódot ILIAS e-learning tananyagban tesszük elérhetővé tanfolyamaink résztvevői számára.

A feladat a Java SE szoftverfejlesztő tanfolyam szakmai moduljának 21-24. óra: Objektumorientált programozás 2. rész, 25-28. óra: Objektumorientált programozás 3. rész, valamint a Java EE szoftverfejlesztő tanfolyam szakmai moduljának 9-12. óra: XML feldolgozás alkalmaihoz kötődik.

Nagyon különböző megoldásokat készíthetünk és szerteágazóan gyakorolhatunk, ha:

az XML fájlt kézzel mentjük a webről és utána a helyi fájlrendszerből dolgozzuk fel,
az XML fájlt közvetlenül a webről, dinamikusan olvassuk,
csak beépített XML-feldolgozást használunk,
külső XML API-t használunk,
DOM, SAX, XSL, van-e DTD,
XPath kifejezésekkel adunk választ a kérdésre,
a fenti didaktikusan egyszerű megoldás helyett haladóbb eszközöket (például: Stream API-t) használunk.

Ajánljuk a Java SE szoftverfejlesztő tanfolyam kategóriából

JFreeChart grafikon készítése

Stream API lambda kifejezésekkel

Hello World! másképpen

ASCII művészet Java-ban

Egy matematika érettségi feladat megoldása programozással 2017

Dr. Sheldon Cooper szólánc játéka

Átnéztem Berci megoldását. Átírva megkaptam, hogy Rómeónak 163 adagnyi beszéde van.

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

1. beszéd: 22 betű

2. beszéd: 74 betű

3. beszéd: 51 betű

4. beszéd: 7 betű

5. beszéd: 40 betű

6. beszéd: 567 betű

7. beszéd: 22 betű

8. beszéd: 471 betű

9. beszéd: 84 betű

10. beszéd: 36 betű

11. beszéd: 125 betű

12. beszéd: 47 betű

13. beszéd: 402 betű

14. beszéd: 293 betű

15. beszéd: 43 betű

16. beszéd: 418 betű

17. beszéd: 44 betű

18. beszéd: 23 betű

19. beszéd: 136 betű

20. beszéd: 36 betű

21. beszéd: 45 betű

22. beszéd: 415 betű

23. beszéd: 10 betű

24. beszéd: 14 betű

25. beszéd: 46 betű

26. beszéd: 276 betű

27. beszéd: 84 betű

28. beszéd: 85 betű

29. beszéd: 86 betű

30. beszéd: 128 betű

31. beszéd: 166 betű

32. beszéd: 95 betű

33. beszéd: 219 betű

34. beszéd: 21 betű

35. beszéd: 65 betű

36. beszéd: 29 betű

37. beszéd: 23 betű

38. beszéd: 49 betű

39. beszéd: 58 betű

40. beszéd: 334 betű

41. beszéd: 42 betű

42. beszéd: 454 betű

43. beszéd: 143 betű

44. beszéd: 45 betű

45. beszéd: 101 betű

46. beszéd: 97 betű

47. beszéd: 69 betű

48. beszéd: 21 betű

49. beszéd: 62 betű

50. beszéd: 39 betű

51. beszéd: 90 betű

52. beszéd: 1089 betű

53. beszéd: 302 betű

54. beszéd: 6 betű

55. beszéd: 106 betű

56. beszéd: 169 betű

57. beszéd: 46 betű

58. beszéd: 183 betű

59. beszéd: 132 betű

60. beszéd: 183 betű

61. beszéd: 216 betű

62. beszéd: 89 betű

63. beszéd: 24 betű

64. beszéd: 27 betű

65. beszéd: 39 betű

66. beszéd: 51 betű

67. beszéd: 51 betű

68. beszéd: 123 betű

69. beszéd: 21 betű

70. beszéd: 158 betű

71. beszéd: 129 betű

72. beszéd: 10 betű

73. beszéd: 22 betű

74. beszéd: 42 betű

75. beszéd: 86 betű

76. beszéd: 26 betű

77. beszéd: 188 betű

78. beszéd: 22 betű

79. beszéd: 47 betű

80. beszéd: 86 betű

81. beszéd: 284 betű

82. beszéd: 345 betű

83. beszéd: 42 betű

84. beszéd: 26 betű

85. beszéd: 115 betű

86. beszéd: 43 betű

87. beszéd: 59 betű

88. beszéd: 102 betű

89. beszéd: 23 betű

90. beszéd: 30 betű

91. beszéd: 18 betű

92. beszéd: 37 betű

93. beszéd: 59 betű

94. beszéd: 58 betű

95. beszéd: 80 betű

96. beszéd: 28 betű

97. beszéd: 48 betű

98. beszéd: 108 betű

99. beszéd: 21 betű

100. beszéd: 59 betű

101. beszéd: 160 betű

102. beszéd: 23 betű

103. beszéd: 20 betű

104. beszéd: 122 betű

105. beszéd: 68 betű

106. beszéd: 56 betű

107. beszéd: 155 betű

108. beszéd: 25 betű

109. beszéd: 306 betű

110. beszéd: 34 betű

111. beszéd: 44 betű

112. beszéd: 42 betű

113. beszéd: 25 betű

114. beszéd: 257 betű

115. beszéd: 264 betű

116. beszéd: 173 betű

117. beszéd: 209 betű

118. beszéd: 37 betű

119. beszéd: 201 betű

120. beszéd: 40 betű

121. beszéd: 29 betű

122. beszéd: 284 betű

123. beszéd: 92 betű

124. beszéd: 330 betű

125. beszéd: 28 betű

126. beszéd: 25 betű

127. beszéd: 114 betű

128. beszéd: 48 betű

129. beszéd: 132 betű

130. beszéd: 306 betű

131. beszéd: 988 betű

132. beszéd: 41 betű

133. beszéd: 164 betű

134. beszéd: 51 betű

135. beszéd: 309 betű

136. beszéd: 94 betű

137. beszéd: 8 betű

138. beszéd: 264 betű

139. beszéd: 254 betű

140. beszéd: 43 betű

141. beszéd: 41 betű

142. beszéd: 98 betű

143. beszéd: 270 betű

144. beszéd: 400 betű

145. beszéd: 52 betű

146. beszéd: 49 betű

147. beszéd: 85 betű

148. beszéd: 91 betű

149. beszéd: 86 betű

150. beszéd: 710 betű

151. beszéd: 134 betű

152. beszéd: 113 betű

153. beszéd: 1086 betű

154. beszéd: 344 betű

155. beszéd: 321 betű

156. beszéd: 38 betű

157. beszéd: 328 betű

158. beszéd: 781 betű

159. beszéd: 104 betű

160. beszéd: 178 betű

161. beszéd: 427 betű

162. beszéd: 47 betű

163. beszéd: 2041 betű

Amire rákérdeznék: a betűk számát összegezve 25299-et kaptam. Sándor írtad a cikkben, hogy Rómeó 24075 betűnyi szöveget mond. Mi lehet az eltérés oka?

Válasz

Ajánljuk a Java SE szoftverfejlesztő tanfolyam kategóriából

“Rómeó és Júlia” bejegyzéshez 8 hozzászólás

Szólj hozzá! Válasz megszakítása